![](/user_photo/_userpic.png)
книги / Математические методы принятия решений
..pdfсоответственно детерминированными функциями и детерминиро ванными величинами.
Когда функции и величины содержат ошибки, получаем сме щенные оценки, например, разделяющих функций и, как следствие, увеличение числа неверных решений. Полный учет статистических характеристик наблюдаемых векторов признаков в задачах приня тия решения приведет к уменьшению числа ложных решений.
Пусть D — пространство решений d, О — пространство обра зов (о (или пространство параметров в статистических задачах принятия решения), R —пространство потерь, которые могут быть получены в результате решения d и исхода (образа) to. Каждый образ и>е П характеризуется вектором признаков Ç, а также счита ются известными для каждого класса образов соj, j = 1, 2, ... ,m , многомерные условные функции плотности вероятностей векторов признаков р(2[ | со7), которые оцениваются по результатам наблюде ний векторов признаков £. Координаты векторов £ в силу различных случайных помех не наблюдаются, а наблюдаются случайные вели чины х, связанные с \ следующим соотношением: х = Ç + 8, где 8 — случайная аддитивная помеха с известным законом распределения. В частности, во многих случаях можно считать, что 8 подчиняется многомерному нормальному закону распределения с нулевым мате матическим ожиданием и известной ковариационной матрицей 82/ (I — единичная матрица).
В рассмотренных традиционных методах решения статистиче ских задач распознавания образов (статистических задач принятия решения) с фиксированным объемом выборки можно выделить два этапа: на первом этапе по результатам наблюдений случай ного вектора признаков х\, х г , ..., х п получают оценки плотностей условных распределений в виде р(х \ u>j) и функции распределения образов P(<Oj), j = 1, 2, ... ,m ; на втором этапе, считая известны ми р(х | <x>j) и P(oj), j = 1, 2, . . . , т, наблюдаемый вектор х относят к некоторому классу (Oj, j = 1,2,..., т (рис. 6.7).
На рис. 6.7 L(d, Wj) — функция ущерба от принятия решения d, когда выбран объект от,; P(tOj) — априорная вероятность появления объекта CÙJ. Классификация проводится путем минимизации веро ятности ошибочного распознавания, в процессе которой получается решающее правило 8(х).
Рис. 6.7. Блок-схема традиционной процедуры обучения системы и рас познавания образов
В традиционных методах на втором этапе условные распределе ния р(х | (ùj), j = 1, 2, . . . , т, являются детерминированными функ циями, а случайная величина (вектор) х —детерминированной вели чиной (вектором). В силу этого получаемые разделяющие функции также являются детерминированными. В действительности следу ет оценить «истинные значения» признаков \ и функций p(Ç | оу,), j = 1, 2, . . . , т, которые в процессе обработки результатов наблюде ний X], Х2, ..., хп должны иметь интервальные оценки, а если вид функций р(£ | (ùj) был выбран априори, то должны быть указаны ин тервальные оценки их параметров и самих функций. Соответствен но, должны быть представлены интервальные оценки разделяющих функций и наблюдавшейся перед классификацией случайной вели чины х.
Задача классификации объектов с учетом интервальных оце нок исходных данных усложняется, но уменьшается число ложных распознаваний. Учет интервальных оценок разделяющих функций
и наблюдавшихся перед классификацией величин чрезвычайно ва жен в практических приложениях, когда координаты вектора при знаков достаточно близки для различных объектов, а точность из мерения этих признаков соизмерима с разностью значений призна ков. Например, при радиолокационных измерениях характеристик различных типов самолетов точность измерения соизмерима с раз ностью значений этих характеристик.
Вобщем случае байесовский риск (который определяет раз деляющую функцию) относительно мало чувствителен к ошибке (приращению) в выборе значения априорного распределения P(<l>J), j = 1,2, ... , т. Если функция байесовского риска кусочно линейна, то приращение байесовского риска равно нулю, когда приращение распределения P(cùj) содержится в интервале линейности функции байесовского риска. Поэтому далее априорное распределение Р(ы*) мы часто рассматривать не будем.
Вдействительности измеренные значения вектора признаков
имеют две компоненты: истинное значение \ и помеху 8, т. е. х = |
|
= !; + 8. Неучет помехи 8 приводит к смещенным оценкам всех |
|
характеристик, в расчете |
которых участвует значение х. Кроме |
этого, необходимо учесть |
интервальные оценки всех рассчитыва |
емых |
функций и величин: р(Е, \ ь>j) и ошибок первого |
и второго |
рода |
(в традиционных методах этого не делают), что |
приводит |
к появлению зон неопределенности в принятии решений даже при фиксированном объеме выборки. Наблюдаемые значения при знаков х И в процедуре идентификации также содержат помеху, и идентификацию объектов следует проводить по оценке истин ного значения £н, а не по наблюдаемому значению х„. Определить оценку величины можно, используя только всю информацию, по лученную на первом этапе. Таким образом задача идентификации практически не разделяется на независимые этапы, а имеет общую схему (рис. 6.8).
На рис. 6.7 и 6.8 прямоугольниками с надписью ПК обозна чены процедура обработки результатов наблюдений и ее алгоритм; на рис. 6.8 утолщенной обводкой прямоугольников обозначены бло ки, которых либо нет в традиционных методах, либо эти блоки претерпевают существенные изменения по сравнению с традици онным подходом.
Рис. 6.8. Блок-схема единой процедуры обучения системы и распознавания образов
Из алгоритмов распознавания образов, представленных в блоксхеме, приведенной на рис. 6.8, видно, что изменяются конкретные значения оцениваемых функций и параметров по сравнению с тра диционными алгоритмами (а это приводит и к иным практическим выводам) и появляется область неопределенности, когда идентифи кацию объектов, в принципе, произвести невозможно.
Ниже будет показано, что в процессах принятия, решений да же при фиксированном объеме выборки появляются зоны неопре деленности, в которых необходимо применять процедуры методов последовательного принятия решений. Естественно, что учет по грешности наблюдаемых значений признаков приведет к измене нию верхних и нижних останавливающих границ и среднего числа наблюдений до принятия решений и в последовательных методах принятия решений.
Отсюда приходим к математической постановке задачи. Введем некоторые обозначения. Каждый объект в задаче рас
познавания образов характеризуется вектором признаков £. В экс перименте из-за помех вместо величины \ наблюдается случай ная величина х = £ + 5. Для величины х может быть задана как плотность распределения вероятности признаков (для непрерывных случайных величин), так и функция вероятности (для дискретных случайных величин).
Пусть до принятия решения d, принадлежащего множеству ре шений D, задано параметрическое пространство исходов П и для всех со е П задана обобщенная плотность распределения вероятно сти р(со) (где Ü — пространство образов со или пространство па раметров со в статических задачах решения). Задана вещественная функция полезности u(co, d) или функция потерь L(со, d) = —и(со, d) на произведении ü х D пространств.
Пусть S — выборочное пространство возможных значений на блюдаемого признака \ исхода со, когда значение признака не на блюдается, а наблюдается случайная величина х, связанная со зна чением признака Ç соотношением х = 2; + 8, где 8 — аддитивная помеха, плотность распределения /(х ) которой и числовые ха рактеристики плотности распределения предполагают известны ми, в частности это может быть нормальный закон распределения
с математическим ожиданием М(5) = 0 и дисперсионной матрицей 0 (8) = а 2/, где I — единичная матрица.
Пусть задано с точностью до значений параметров парамет рическое семейство условных обобщенных вероятностных плот ностей (о.в.п.) р(£, 0 1со), w e î î . При неизвестных о. в.п. p(i, 0 1со) должно быть задано параметрическое семейство разделяющих
функций /i(£, 0).
Пусть выбрана из класса решающих функций Д функция ср(£),
определяющая для |
любого возможного значения £ е S решение |
|
d(t) е D и минимизирующая функцию среднего риска |
||
p(co,d©) = M{L(co,d(0)} = |
|
|
= |
J | Ц со, |
9 1со)р(со) dp&) dv(co), (6.24) |
|
a s |
|
где для всех соеП |
функция |
L(co, d(Q) измерима и интегрируема |
на множестве S. |
|
|
Требуется по выборке фиксированного объема результатов на блюдений х или в методах последовательного принятия решений
найти: |
|
|
1) точечные и |
интервальные оценки параметров |
0 условных |
о. в. п. р(£, 0 1со), |
а также точечные и интервальные |
оценки са |
мих условных о. в. п. р(£, 0 | со); при неизвестных о. в. п. р(£, 0 1со) — точечные и интервальные оценки параметров 0 и разделяющих функций h(i, 0);
2)точечные и интервальные оценки решающих функций ср(£);
3)оценки X «истинных» значений вектора признаков £, по кото рым впоследствии принимается решение d e D.
После этого необходимо произвести идентификацию наблюда емого объекта, т. е. поставить в соответствие наблюдаемому зна
чению вектора признаков х некоторый образ со., и определить при этом точечные и интервальные оценки суммарной ошибки и ошибок первого и второго рода, возникающих при принятии ре шения d e D .
В соотношении (6.24) запись выражений ф (£ ) и dv(£) означа ет, что интеграл р(со, d(£)) понимается как обычный интеграл для
непрерывных случайных величин \ и со и как сумма для дискрет ных величин. При любом наборе (со, d ) € ü х D функция L(со, d) представляет собой потери для лица, принимающего решение d при исходе со.
В отличие от этой постановки в традиционной постановке за дачи распознавания образов не учитывают помехи 8, величины \ и х отождествляют, не определяют интервальные оценки функ ций р ( £ , 0 | со), h(i, 0) и <p(Ç), не определяют оценки \ и интервальные оценки ошибок первого и второго рода (а и Р). Отсутствие уче та помех 8 и оценок \ приводит к смещенным точечным оценкам р ( £ , 0 | со), h(i, 0) и ср(£ ), к неверным интервальным оценкам и к лож ным практическим выводам.
Г л а в а 7
МЕТОДЫ РЕГРЕССИОННОГО И КОНФЛЮЭНТНОГО АНАЛИЗА
КАК ИНСТРУМЕНТ В ПРОЦЕДУРАХ ПРИНЯТИЯ РЕШЕНИЙ
§7.1. Понятие регрессии. Основные определения
При определении вида функции плотности распределения ве роятности распознаваемых классов или разделяющих (решающих) функций в качестве исходных данных используют выборки, полу ченные в результате конкретных экспериментов. Как любые экс периментальные значения, исходные данные содержат ошибки, которые существенно влияют на результаты решений задач. По скольку рассматриваемые алгоритмы учета погрешностей исходных данных будут применяться к различным функциям: условным плот ностям вероятности, разделяющим (решающим) функциям, то из меренные значения признаков обозначим переменной х, а значения оцениваемых функций — у(х). Будем считать, что общий вид оце ниваемых функций априори известен, но надлежит найти точечные
иинтервальные оценки свободных параметров этих функций, по ко торым можно определить точечные и интервальные оценки самих функций.
Модели, позволяющие учитывать ошибки в значениях функций
иаргументов, рассматриваются в [8, 9, 16, 20-24, 30, 40, 87, 94-96, 99, 100, 102-104, 106, 108, 109]. Наиболее часто [2, 14, 45, 76, 80, 93] встречается постановка задачи определения оценок вектора па раметров 0 модели
Vi = f(xi, 6) |
+ Zi, г = 1, 2, . . . , n, |
|
где Ej — случайная ошибка, |
имеющая нормальное |
распределение |
с параметрами М(е0 = 0, D(ej) = о?, Dfo, еj) = 0, |
г, j = 1, 2, . . . , n. |