Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Гряник В.Н., Павликов С.Н.Г. Теория и техника р...doc
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
2.87 Mб
Скачать

4.5. Вычисление дисперсий оценок и функции неопределенности

Как указывалось ранее, оценка по максимуму правдоподобия эффективна всякий раз, когда строго эффективная оценка вообще существует. Однако во всех случаях выполнения условий регулярности ОМП асимптотически эффективна. Таким образом, можно считать дисперсию ОМП совпадающей с границей Крамера-Рао. При существовании эффективной оценки это совпадение абсолютно точно, в других же случаях дисперсия ОМП тем ближе к названной границе, чем информативнее наблюдения, т. е. чем правомернее ориентир на асимптотическую эффективность ОМП. Как отмечалось, для проявления механизма асимптотической эффективности необходимо заметное превышение энергией сигнала интенсивности шума либо достаточная продолжительность наблюдений. Полагая требования, гарантирующие равенство (точное или приближенное) дисперсии ОМП границе Крамера-Рао, соблюденными, конкретизируем выражения для последней применительно к измерениям параметров сигнала, маскируемого аддитивным белым шумом.

Матрица Фишера , i,k=1-r, (4.17)

где q2 =2E/N0 – отношение сигнал/шум на выходе согласованного с сигналом s(t;υ) фильтра, а функция

(4.18)

- называется функцией неопределенности (ФН) сигнала s(t; υ) по параметру υ. Очевидно, ФН есть коэффициент корреляции двух копий сигнала s(t ; υ), имеющих различные значения (υ0 и υ) измеряемого параметра υ. Кроме того, |χ (υ0 , υ)|≤ |χ (υ0 , υ0)|=1.

Дисперсия ОМП равна

Таким образом, повышению точности ОМП скалярного параметра υ способствует, с одной стороны, увеличение энергии сигнала, т. е. величины q, а с другой — применение таких сигналов, у которых ФН имеет по возможности острый пик (большую по абсолютному значению отрицательную вторую производную) в точке υ = 0.

4.6. Элементы теории фильтрации параметров сигналов

Как указывалось ранее, фильтрацией называют измерение текущих значений параметров сигнала, меняющихся в процессе наблюдения. Таким образом, целью фильтрации является формирование оценки (t) значения зависящей от времени величины (в общем случае векторной) υ(t)=(υ1(t),..., υг(t))T, входящей в качестве параметра в сигнал s(t; υ(t)). Сигнал доступен наблюдателю в смеси с помехой, так что колебание, на основании которого должна быть построена искомая оценка (t), описывается вариантом соотношения (4.1) y(t) = F[s(t; υ(t)), x(t)], (4.19)

которое в теории фильтрации называют уравнением наблюдения. Отметим, что, распространив на задачу фильтрации идеи, изложенные в п. 4.2, мешающие параметры сигнала ψ(t) можно присовокупить к информационным, увеличив размерность вектора последних. Поэтому в (4.19) мешающие параметры самостоятельно не фигурируют.

Из приведенного определения ясно, что текущая оценка (t) в процессе фильтрации формируется исходя из всей полученной вплоть до момента t информации, т. е. с учетом значений наблюдаемой реализации у(ξ) при всех ξ<t.

Родственной является задача прогнозирования или экстраполяции, когда по наблюдениям у(ξ) вплоть до момента t требуется предсказать будущее значение параметра υ(t + τ) при τ>0. Если измеряют значения параметра в моменты времени, предшествующие t(υ(t — τ), τ>0), то такую процедуру называют сглаживанием или интерполяцией.

К фильтрации сводятся многие классические радиотехнические задачи. Так, в традиционных системах передачи непрерывной информации (радиовещание, телевидение, радиосвязь и т. д.) передаваемое сообщение модулирует тот или иной параметр излучаемых высокочастотных колебаний, на приемной же стороне для восстановления сообщения осуществляют демодуляцию, состоящую в непрерывном отслеживании амплитуды, частоты или фазы (в зависимости от вида модуляции) колебаний, т. е. фильтрацию названных параметров. В то же время теория фильтрации используется и для решения сложных задач, таких, как обработка информации в многозвенных комплексах, объединяющих разнородные системы. Для того чтобы исследовать задачу фильтрации перепишем уравнение наблюдения (4.68) в векторной форме: y(t) = s(t; υ(t)) + x(t).

В этой записи учтена возможность получения информации о υ(t) из разнородных наблюдений, т. е. из множества N параллельно наблюдаемых реализаций yi(t) процессов, записанных как одна реализация N-компонентного векторного колебания y(t)=(y1(t), y2(t), yN(t))T

Независимо от конкретного содержания той или иной задачи удобно считать, что каждому скалярному колебанию yl(t) отвечает свой индивидуальный l-и канал. Каждая из реализаций, т. е. каждый из N каналов, содержит свой полезный сигнал sl(t;υ(t)); являющийся детерминированной функцией t и измеряемого параметра υ(t). Все N сигналов сведены в одну N-компонентную векторную функцию - сигнал s(t;υ(t))=(sl(t;υ(t));s2(t;υ(t), sN(t;υ(t)))т- Помеха в (4.69) также представлена в векторной форме x(t)=(x1(t), x2(t), xN(t))T так как в каждом из N каналов присутствует свой шумовой компонент. Появление в (4.69) знака плюс вместо оператора F[.,.] указывает на то, что далее помеха х(t) будет считаться аддитивной: yl(t) = sl(t;υ.(t)) + xl(t), 1=1, 2, ..., N.

Определяющее влияние на алгоритмы формирования (t) имеет вид зависимости s(t; υ(t)) в (4.69) от υ(t). Если это линейная функция υ(t), т. е. зависимость подчиняется принципу суперпозиции, и можно записать s(t; υ(t))=H(t)υ(t), где Н(t)—некоторая Nxr-матрица, элементы которой могут зависеть от времени t, но не от υ(t), то фильтрацию параметра υ(t) называют линейной. В остальных случаях фильтрацию называют нелинейной.

Наряду с непрерывной фильтрацией, осуществляемой при непрерывном наблюдении у(t), можно рассматривать и дискретную фильтрацию или фильтрацию последовательностей, когда наблюдения доступны лишь в отдельные моменты времени ti. Тогда вместо (4.19) используют уравнение наблюдения

yi = sii) + хi. (4.20)

Уравнением сообщения называют

yi = hi υi + ni

υi =bi υi-1 + υi (4.21)

При дискретной фильтрации целью является оценка i-го элемента υ(t), последовательности υi, по наблюдениям уi. Главной проблемой изучаемой области статистической теории РТС является оптимальная фильтрация, т. е. отыскание наилучших в некотором смысле правил формирования текущей оценки υ(t). При этом за основу может быть принят байесовский подход, общие положения которого без затруднений переносятся со случая неизменного в течение наблюдений параметра на рассматриваемый случай.

Из нормальности апостериорной ПВ на (i - 1)-м шаге следует нормальность ее на i-м, что при допущении нормальности υ0 индуктивно доказывает нормальность апостериорной ПВ для любого i. Вспомним, что при квадратичной или простой функциях потерь оптимальными (байесовскими) оценками являются оценки по центру тяжести (апостериорному среднему) либо по правилу МАВ. Но для нормальной апостериорной ПВ среднее и мода совпадают. Следовательно, в качестве оптимальной оценки скалярного измеряемого параметра при линейной фильтрации независимо от функции потерь следует брать апостериорное среднее.

Соотношения

(4.22) — (4.24)

Эти соотношения называются уравнениями фильтра Калмана. Как следует из (4.22), располагая оценкой на предыдущем шаге, фильтр Калмана, основываясь на уравнении сообщения (4.21) прогнозирует оценочное значение bi i-1 на i-и шаг.

По получении i-го наблюдения уi,- прогнозированная оценка подправляется на значение, пропорциональное невязке (обновляющему процессу), т. е. отклонению прогнозированного слагаемого hibi i-1 i-го наблюдения в (4.21) от полученного отсчета уi. Коэффициент пропорциональности, регулирующий вес новых данных (невязки) в υi по сравнению с прогнозом bi i-1 называют коэффициентом усиления фильтра Калмана. Эта величина помимо коэффициента hi в уравнении наблюдения и дисперсии шума наблюдения Kni определяется еще и апостериорной дисперсией Кυ i параметра υi . Последняя совпадает с квадратом разности оценки i и истинного значения υi , усредненным по всем возможным шумам наблюдения, и, таким образом, характеризует точность оценки на i-м шаге. Действия, выполняемые фильтром Калмана, иллюстрируются схемой рис. 4.10, в которой элемент задержки осуществляет запоминание предыдущей, (i-1)-й, оценки до следующего, i-го, шага.

Рис.4.10. Фильтр Калмана

Рисунок, как и поясняемый им рекуррентный (разностный) алгоритм (4.22) - (4.24), показывает, что фильтр Калмана является характерным примером линейной дискретной замкнутой астатической системы регулирования с переменными параметрами. Ее чувствительный элемент (дискриминатор) вырабатывает сигнал рассогласования (невязку) входных данных уi и данных, поступающих по цепи обратной связи hibi i-1 . После взвешивания рассогласование суммируется с ранее накопленным результатом, что эквивалентно введению в замкнутый контур интегратора, исключающего статическую ошибку.

Приведенные рассуждения позволяют понять и алгоритм фильтра Калмана для векторного параметра при векторных наблюдениях.

Техника его вывода не отличается принципиально от использованной ранее, а итогом служат соотношения, которые формально можно получить из (4.85) — (4.87), заменив скаляры соответствующими векторно-матричными аналогами i , yi ,hi, bi ,а дисперсии Kvi, Kni ,Kυi - корреляционными матрицами Kvi, Kni ,Kυi последняя из которых характеризует точность фильтрации векторного параметра υi (4.88)

(4.25) - (4.27)

где Gi — матрица размера r x.N, являющаяся матричным коэффициентом усиления фильтра Калмана.

Суть алгоритма (4.25) - (4.27) осталась прежней; экстраполированная с предыдущего шага оценка после получения i-го наблюдения уi,- корректируется с учетом новой информации, заключенной в невязке уi - HiBi i-1, вклад которой в i определяется матричным коэффициентом усиления Gi.

Пошаговый (рекуррентный) характер алгоритма Калмана, позволяющий получать текущую оценку корректировкой ее предыдущего значения с учетом только очередного (i-го) наблюдения, удобен для реализации на ЭВМ, особенно при необходимости фильтрации в реальном времени, т. е. по мере поступления данных. Подчеркнем, что коэффициенты усиления gi , Gi в (4.22), (4.25), как и характеристики точности оценок Kυi и Kυi, не зависят от входных данных и могут быть рассчитаны заранее для всех значений i и занесены в память ЭВМ, с тем чтобы извлекаться оттуда по мере надобности. Кроме того, на практике нередко приемлемы те или иные упрощения алгоритма Калмана, как, например, замена переменных коэффициентов усиления gi и Gi в (4.22), (4.25) некоторыми не зависящими от i, т. е. переход к квазиоптимальным фильтрам с постоянными параметрами.

Диапазон применений алгоритма Калмана в современных информационных системах чрезвычайно широк. Хотя для доказательства его оптимальности при байесовском подходе пришлось оговорить нормальность помехи, он обладает определенными оптимальными свойствами и по отношению к любым аддитивным помехам. Оказывается, что формируемая им текущая оценка наиболее близка в смысле среднеквадратического отклонения к истинному значению параметра по сравнению с прочими линейными (полученными только линейными преобразованиями наблюдений) оценками. Кроме того, алгоритм Калмана можно усложнить, приспособив и к задачам нелинейной фильтрации.