Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Математические методы принятия решений

..pdf
Скачиваний:
3
Добавлен:
13.11.2023
Размер:
22.94 Mб
Скачать

имеет вид

 

(D{ax)

0

0

'

D(a) =

0

D{a2)

0

 

\о 0 D(h).

Дисперсию D(y) оценок значений разделяющей функции у{а) находим по формуле

f D(âx)

0

° \

/ 3/1

0(у) = (уьу2 ,уз)

0

D(a2)

I У2

°

V

о

0

V

D(S3) /

= У?D(âi) + y|D(22) + y3D(23).

Зная значения у(а) и D(y), для каждого у построим дове­ рительные интервалы значений у = у(а) разделяющей функции. Огибающая линия, проведенная по этим точкам, даст интерваль­ ную оценку (зону неопределенности в принятии решений) данной разделяющей функции. Пусть доверительная вероятность равна р (Р = 0,95; 0,997;...). Интервальная оценка для каждой точки у раз­ деляющей функции определяется условием

Р {у ~ Ц^/Щ) < yip) < У + t y V ® } = Р>

где £р — квантиль распределения Стьюдента — определяется выбран­ ным значением р и числом степеней свободы v = п т (п — число наблюдаемых точек, т число оцениваемых параметров). Здесь У = у(2) — значения у{а) при найденных оценках а. Задав значе­ ние р, выбираем значение tp и определяем зону неопределенности принятия решений с помощью предлагаемой разделяющей функ­ ции. При малом числе эталонных наблюдений эта зона будет доста­ точно большой.

В ряде случаев область неопределенности может быть получена аналитическим путем. Разделяющий вектор а может быть опреде­ лен по методу наименьших квадратов, когда в качестве критерия рассматривается функция

Л(а, Ь) = ||Уа - Ь||2,

где Y матрица измеренных значений признаков, b— вектор до­ пуска.

Метод наименьших квадратов позволяет получить не только оценки а, но и дисперсию этих оценок D(a) (см. § 7.5). При ковари­ ационной матрице измерений D(y) функцию J s(a, Ь) можно записать в виде

Js(a, b) = (Y а - b)rD -\y )(Y a - b).

Тогда дисперсия оценок а будет иметь вид

D(Ô) = [y TD -‘( y ) n _1

Дальнейшие действия при найденных оценках а и D(a) ана­ логичны ранее описанным: находятся оценки разделяющей функ­ ции у(а) и дисперсии значений D(y) этой функции, затем опреде­ ляются интервальные оценки разделяющей функции, а тем самым и зона неопределенности принимаемых решений.

§ 9.6. Распознавание образов по измеренному вектору признаков

Пусть известны средние квадратические отклонения для по­ грешности измеренных векторов признаков х как в процессе обу­ чения системы распознавания, так и в процессе идентификации об­ разов. Закон распределения погрешностей наблюдений неизвестен, число точек наблюдения ограничено. Будем искать обобщенную линейную разделяющую функцию.

Рассмотрим обобщенную линейную разделяющую функцию

д(х) = а7у,

где о —весовой вектор, у —вектор, координатами которого явля­ ются константа 1 и функции от х, определяющие вид разделяю­ щих функций (линейные, полиномиальные и т. д.). Задача сводится к определению весового вектора (вектора решения) а. Для одно­ значного выбора вектора решения следует ввести некую целевую функцию (или критерий). Чтобы включить в рассмотрение погреш­ ности наблюдений х (а они трансформируются по формулам пере­ носа ошибок в погрешности для у), используем метод наименьшей квадратичной ошибки. С учетом погрешностей наблюдений при­ знаков, как подробно показано в гл. 7, целевая функция, минимум

которой определяет вектор решений а, имеет вид

п

J ( a ) = J]

- bi)2 + (Ç<- ViŸl

(9 .4 )

2=1

 

 

 

где Zi — истинное значение уи т.е. yi = Zi +

h — вектор допус­

ка, который также должен быть определен. Функция критерия J(o) использует все выборки.

Функционал (9.4) получен как функционал ортогональной ре­ грессии в предположении, что средние квадратические отношения признаков равны единице. Необходимо его дополнить условием для нахождения неизвестного вектора Z-

дДа)

(9.5)

„ = 0.

SZ 5=5

 

Преимуществом выбранного критерия является тот факт, что решение, следующее из этого критерия, приближается в пределе к разделяющей функции Байеса go(x) = P(coi | х) Р(о>2 1х), хотя может не обеспечивать минимальную ошибку решения.

Рассмотрим два подхода:

1)вектор допуска b задается;

2)вектор допуска b оценивается в алгоритме построения разде­ ляющей функции.

Впервом случае все координаты вектора b равны - 1 , если на­ блюдения относятся к образу U|, и равны + 1, если наблюдения относятся к образу согТогда

J(a) = J] [(aTZ -

I)2 + (Ç - У)2] + J] [(aTZ + I)2 + (Ç - у)2],

уёУ\

уеУг

где Y\ и Уг — множества наблюдений для o i и «2 соответственно. Объединив условия (9.4) и (9.5), для обобщенной линейной раз­ деляющей функции получим функционал (9.4) в более приемлемом

для практического применения виде:

 

 

/

к

\ 2

 

/

к

\ 2

 

 

п\ ( £

O L iV ij - 1 )

п 2

( £

( H V i j + 1 )

 

т

= 2

4 = 1

________ J +

^

4=1 ________ {_

(9.6)

 

 

 

 

 

 

 

 

j=i 1

+

£ a j a 2 ( y i )

i = n i + l

1

+

£ a j a 2 ( y i )

 

i—1

i—1

где a 2(j/i) = о2(х{) — средняя квадратическая ошибка г-го вектора наблюдений, одинаковая во всех наблюдениях; j = 1, 2, . . . , щ — номер наблюдений для а>ь j = п\ + 1, ... ,П 2 —номер наблюдений

ДЛЯ 6)2-

Точка минимума функционала (9.6) определяет точечную оцен­ ку вектора решения a, a следовательно, и точечную оценку разде­ ляющей функции. Ковариационная матрица оценки вектора реше­ ния а определяется из условия

D(a) = iV -1, N =

d2J(a)

k,

l, m = 1, 2,

 

dülddm.

 

a дисперсия значений разделяющей функции в точке наблюдения у имеет вид

D(g(y)) = yrD(a)y,

где у = (у\,У2, ■■■,УкУ•

При неизвестных векторах допуска Ь, как следует из результатов гл. 7 для линейной функции, функционал (9.6) приобретает вид

71

j( o ) = 2

з= 1 1 + 2 alo2(yi)

i — 1

где принято, что координаты вектора Ь— детерминированные ве­ личины. Для каждой оценки вектора а с помощью градиентного спуска образуется последовательность векторов допуска b:

Ь\ > 0, &v+i = 6V+ 2ре+,

где

= T ( ev + Ы)> ev = d[y bv, 0 < p < 2.

В процедуре идентификации образов по вектору наблюдений х н строится вектор уИ, который присоединяется к вектору ранее про­ веденных наблюдений, и с помощью функционала (9.6) или усло­ вия (9.5) для каждой j -й гипотезы определяются оценки ^ „, по ко­ торым принимается решение.

Результат определения линейной разделяющей функции и идентификации летательных аппаратов по наблюдаемому векто­ ру (xi„, Х2н) приведен на рис. 9.2. Различие решающих функций

отличие оценок «истинных значений» наблюдаемого вектора « i l , S72X 3 = 1, 2, от вектора (rci„, хгн) очевидны.

Рис. 9.2. Распознавание образов с учетом погрешности наблюдений при­ знаков с помощью линейной разделяющей функции

На рис. 9.2 указаны значения признаков и погрешности их из­ мерения для двух объектов. Светлые точки относятся к одному объекту, темные — к другому. Представлены линейные разделяющие функции как с учетом погрешности измерения (сплошная линия), так и без учета погрешности (линия из точек). Для первой разде­ ляющей функции определены интервальные оценки (штрихпунктирные линии). По наблюдаемым значениям (xi„, хгн) определены оценки «истинных» значений координат точки наблюдения «1 и ^)- Точку наблюдения присоединяем последовательно к предшествую­ щим выборкам для каждого объекта.

Получены соответственно значения « 11Д 12) и « 21.^ 22). по ко­ торым следует принимать решение.

§9.7. Алгоритм идентификации объектов

сучетом погрешности признаков

Рассмотрим задачу распознавания (идентификации) объектов, когда закон распределения признаков не известен, но известны значения признаков и, возможно, средние квадратичные отклоне­ ния измеренных значений признаков.

Алгоритм построения разделяющей функции может опираться на всю совокупность обучающей выборки или использовать толь­ ко часть точек и признаков. Рассмотрим обобщенные линейные разделяющие функции, весовой вектор в которых оценивается с по­ мощью операции минимизации квадратичной невязки. При этом используем методы конфлюэнтного анализа, в которых учитывают­ ся погрешности наблюдений признаков при минимизации функци­ онала квадратичной невязки при фиксированном векторе допуска (пороге).

Для минимизации функционалов применяется одна из разно­ видностей метода покоординатного спуска с контролем точности результатов и с переменным шагом. Динамическое размещение мас­ сивов переменных в памяти компьютера позволяет рассматривать задачи произвольной размерности. Для решения систем линейных алгебраических уравнений и операций с матрицами применяются соответствующие стандартные процедуры.

На рис. 9.3 представлена общая блок-схема компьютерной про­ граммы, реализующей данный алгоритм. Программа написана на языке Fortran-90 в среде Microsoft Developer Studio с привлечением некоторых стандартных вычислительных процедур, а также диало­ говых и графических возможностей Windows 95, 98.

Компьютерная программа используется для определения и гра­ фического представления поверхности, разделяющей эксперимен­ тальные точки двух классов, а также идентификации на этой основе неизвестных точек. Программа применима для произвольного чис­ ла точек и признаков. В ней учитываются погрешности измерений. Программа работает в диалоговом режиме в операционной среде Windows 95, 98 и более поздних версий.

При работе программы используются следующие файлы:

1)выполняемый Split.exe;

2)содержащий числовые данные для точек класса 1 (например,

Filel);

3)содержащий числовые данные для точек класса 2 (например,

File2);

4)содержащий числовые данные для точек, подлежащих иден­ тификации («новых точек») (например, FileN).

Рис. 9.3. Общая блок-схема программы

Размещение и имена файлов с данными —произвольные, но структуры данных в этих файлах одинаковы и строго определены. Все данные находятся в текстовом виде и могут редактироваться в произвольном редакторе.

Первая строка — произвольный текст, описывающий содержа­ ние файла.

Вторая строка — два целых числа, разделенных пробелами. Пер­ вое число — количество признаков, второе — количество точек.

Третья и последующие строки содержат собственно данные. Числа в строках записаны в произвольном формате, но между ними

должно быть не менее одного пробела. Номер столбца определяет номер признака, а номер строки — номер точки.

После запуска программы (файл Split.exe) запрашивается имя файла с данными класса 1 (Filel) и с данными класса 2 (File2).

Затем появляется основное диалоговое окно, где с помощью стандартных средств Windows необходимо выбрать, какие точки (Class 1 и Class2) и какие признаки (Features) будут использованы для вычисления и построения разделяющей поверхности. Здесь же можно установить значения вектора допуска (Ь1,Ь2) и стандартных отклонений (Dispersion) наблюдаемых точек в зависимости от при­ знака, а также задать тип разделяющей функции: линейная (linear) или квадратичная (quadratic).

Кнопка «ОК» запускает процедуру построения разделяющей поверхности. Результаты отображаются в нескольких окнах на экране.

1.Окно «Graphic: Deviation from discrimination surface» содер­ жит графическое представление отклонений наблюдаемых точек от разделяющей поверхности. Цветные прямоугольные контуры да­ ют соответствующие интервальные оценки разделяющей функции.

2.Окно «Table: Deviation from discrimination surface» содержит

восновном те же данные в виде таблицы.

3.Окно «Parameters» содержит некоторые характеристики, опи­ сывающие процедуру расчета разделяющей функции.

4.Окно «Discrimination Line-2D» открывается, когда число при­ знаков равно двум. В этом окне представлены распределение вы­ бранных наблюдаемых точек на плоскости (оси эллипсов соответ­ ствуют величинам стандартных отклонений), разделяющая линия (черным цветом), ее интервальные оценки (синим цветом). Для про­ смотра окно следует выделить и расширить.

После анализа результатов необходимо нажать кнопку на экране «Push to continue» (левый верхний угол экрана) для продолжения работы программы.

При этом открывается диалоговое окно «Repeat calculations or Input new points», в котором предлагается сделать выбор:

1)вернуться к предыдущему этапу работы программы (Repeat points selection);

2)перейти к вводу новой точки для ее идентификации (Input new points);

3)перейти к анализу влияния небольших случайных отклоне­ ний наблюдаемых точек на положение разделяющей линии (Points random deviation).

Вариант 3) возможен только для плоского случая. При выборе этого продолжения и дальнейшем многократном нажатии кнопки на экране «Push to continue» происходят случайные вариации по­ ложения наблюдаемых точек и соответствующий пересчет разде­ ляющей функции. Результаты отображаются в окне «Discrimination Line-2D».

Выбор варианта 2) приводит к этапу ввода и анализа новой точ­ ки. При этом открывается диалоговое окно, где необходимо указать имя файла с новыми данными (FileN). После этого в другом диа­ логовом окне надо отметить одну точку для исследования. Затем в режиме диалога предлагается выбрать одно из продолжений:

а) отобразить положение новой точки и интервальные оценки на графике в окне «Graphic: Deviation from discrimination surface»; б) добавить новую точку к точкам класса 1 и пересчитать поло­ жение разделяющей поверхности; результаты отображаются так же,

как описано выше при вычислении разделяющей функции; в) добавить новую точку к точкам класса 2 и пересчитать положе­

ние разделяющей поверхности; результаты отображаются, как в п. б). После анализа результатов можно нажать кнопку «Push to continue» для продолжения работы с другой новой точкой или закрыть приложение (программу) обычным образом. Содержимое

окон можно копировать и выдавать на печать.

Программное обеспечение включает в себя выполняемый файл Splitexe и файлы с данными. Программа выполняется в диалоговом режиме в операционной среде Windows 95, 98.

Выполнение программы прерывается, если:

1)

файлы данных не имеют предписанной структуры;

2)

в

соответствующих диалогах не выбрано ни одной точки

и (или) ни одного признака.

Об

 

этом выдается соответствующее предупреждение. В этих

случаях

необходимо запустить программу снова. Предупреждения

И 16 — 4077

Соседние файлы в папке книги