- •Тема 9. Статистический подход к распознаванию образов: оценка неизвестной плотности вероятности
- •1. Разобрать способ выбора неизвестной плотности вероятности на основе априорной информации:
- •1. Разобрать способ выбора неизвестной плотности вероятности на основе априорной информации.
- •1.1. Определить понятие энтропии как меры неопределенности опыта со случайными исходами.
- •1.2 Принцип максимума энтропии
- •1.3 Общее решение задачи с помощью метода неопределенных множителей Лагранжа
- •2. Способ оценки неизвестной плотности вероятности по апостериорным данным путем аппроксимации функциями.
- •2.1. Определения
- •2.2. Построение функций многих переменных
- •Многочлены Лежандра
- •Многочлены Лагерра
- •Многочлены Эрмита
- •2.4 Аппроксимация плотностей распределения функциями
1.3 Общее решение задачи с помощью метода неопределенных множителей Лагранжа
Использование множителей Лагранжа позволяет построить функцию
, (2)
где a0 = 1 и b0(x) = 1 для всех образов x.
Взяв частные производные от функции H1 по плотности распределения p(x), имеем
(3)
Приравняв подынтегральное выражение нулю и выразив из этого уравнения p(x), получим
(4)
Здесь Q+1 параметров следует выбирать так, чтобы они соответствовали априорной информации об образах х, содержащейся в соотношениях (*) и (**).
Исходя из (4), легко показать, что, когда известно, что случайная величина отлична от нуля только в конечном интервале, следует выбирать равномерное распределение. Если случайная величина может принимать любое действительное значение, а единственными разумными характеристиками считаются математическое ожидание и дисперсия, то следует выбирать нормальное распределение. Выбрав плотность распределения, необходимо заняться оценкой параметров выбранной функции. Проведенный анализ показывает, что при следовании энтропийной концепции выбор нормального распределения является вполне приемлемым допущением, если единственными известными характеристиками образов х являются математическое ожидание и дисперсия.
2. Способ оценки неизвестной плотности вероятности по апостериорным данным путем аппроксимации функциями.
2.1. Определения
Скалярное произведение двух функций f(x) и g(x) в интервале определяется как
Скалярное произведение функции f(x) на себя, называемое нормой функции f(x), вводится как
(2.7.2)
Функция, норма которой равна единице, называется нормированной. Нормировка легко достигается делением функции на квадратный корень ее нормы.
Две функции f(x) и g(x) ортогональны относительно весовой функции и(х) в интервале [а, b], если
(2.7.3)
Система функций каждая пара которых
ортогональна в интервале [а,b], называется ортогональной системой. Для этой системы функций имеют место обычные уcловия ортогональности:
(2.7.4)
где
(2.7.5)
коэффициент, зависящий от параметров i и j. Поскольку правая часть уравнения (2.7.4) всегда равна нулю, за исключением случая коэффициент записывают просто в виде При для всех значений система функций называется ортонормированной системой, а соответствующие условия ортонормированности задаются следующим образом:
(2.7.6а)
Множество функций называется ли-
нейно независимым, если не существует коэффициентов не всех равных нулю и таких, что уравнение
(2.7.9)
справедливо для всех х. Все функции, образующие ортогональную систему, линейно независимы.
И наконец, система функций называется полной, если любую кусочно-непрерывную функцию можно в среднем сколь угодно точно аппроксимировать с помощью линейной комбинации функций, входящих в данную систему.
2.2. Построение функций многих переменных
Пусть нам задана полная система ортонормированных функций одной переменной на интервале В таком случае полную систему ортонормированных функций двух переменных можно построить следующим образом:
(2.7.10)
Отметим, что использованное выше правило построения сводится просто к выбору пар функций из множества функций одной переменной и перемножению их после соответствующей подстановки переменных x1,x2.
Способ распространения описанной процедуры на общий случай п переменных очевиден. Здесь требуется только составлять группы произведений из п функций одной переменной, подставляя соответственно переменные Если исходные функции ортонормированны в интервале то полученные в результате реализации этой процедуры функции п переменных ортонормированны на гиперкубе
В частности, множество функций п переменных при строится следующим образом:
(2.7.13)
где, как и выше,