Добавил:
Студент, если у тебя есть завалявшиеся работы, то не стесняйся, загрузи их на СтудентФайлс! Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Pz_kr_Otsenka_Parametrov_Signala

.pdf
Скачиваний:
4
Добавлен:
16.07.2022
Размер:
1.53 Mб
Скачать

Федеральное агентство железнодорожного транспорта Федеральное государственное бюджетное образовательное учреждение

высшего образования «ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПУТЕЙ

СООБЩЕНИЯ ИМПЕРАТОРА АЛЕКСАНДРА I» (ФГБОУ ВО ПГУПС)

В. К. Котов

Практическое занятие на тему:

«ЗАДАЧА ОЦЕНКИ ПАРАМЕТРА СИГНАЛА»

(Контрольная работа)

Санкт-Петербург

2020

1. Основные положения и особенности теории статистических решений в задачах приема сигналов

Математическая теория проверки гипотез, в которой критерии появляются как решения точно поставленных оптимальных задач выбора между двумя возможностями, была создана Ю. Нейманом и Э. Пирсоном в 1930-е гг. и составляла одну из основных частей классической математической статистики.

Применение этой теории на практике вызывало ряд нареканий, связанных с тем, что стандартные формулировки задачи, связанные с принятием или отклонением основной гипотезы, чрезмерно упрощают задачу.

Например, многие из практических задач проектирования и эксплуатации систем железнодорожной автоматики, телемеханики и связи (СЖАТС), сформулированные в терминах проверки гипотез, в действительности оказываются множественными проблемами решения, когда нужно принять решение, какая из множества выдвинутых гипотез (их может быть больше двух) более всего отвечает требованиям обеспечения надежности функционирования СЖАТС.

С точки зрения классической постановки проверки гипотез потребности практики, в случае отклонения основной гипотезы, приводят к необходимости выбора одного из нескольких решений, а не к ограничению аргументацией того, что основная гипотеза отвергнута.

В итоге, в следствие возникших противоречий между потребностями практики и возможностями теории проверки гипотез в их решении, классическая теория проверки гипотез была пересмотрена венгерским математиком А. Вальдом, который показал, что две центральные проблемы статистической теории, такие как проверка статистических гипотез и статистическая теория оценивания, можно рассматривать как специальные случаи более общей теории принятия решений, основанной на введении статистических решающих функций (функции потерь, функции риска), допустимых решающих правил, байесовских правил решения, минимаксных решающих правил.

Очевидно, что для проведения статистического исследования нужна совокупность результатов измерений (наблюдений), представляющая собой значения случайной величины Y - отсчеты смеси сигнала и помехи (y(t)=Si(t) + n(t)) на интервале действия сигнала, количество которых весьма ограничено из-за его малой длительности: один-два отсчета, если длительность не более трех микросекунд; 3 – 9 если длительность не более 10 миллисекунд.

Если это допустимо по условиям задачи оценки параметра сигнала (одно из них – стационарность случайного процесса y(t)), то можно накопить значения

2

отсчетов за 1-2 секунды и анализировать выборку, называемому временным рядом, содержащим 1000-2000 отсчетов при длительности импульсов, равных 1 мс. Если анализ накопленных данных позволяет допустить, что процесс y(t) является стационарным и эргодическим, то есть устойчивым, то кроме оценки параметра сигнала (амплитуды, частоты, фазы, длительности) можно делать прогноз о значении параметра на последующем интервале времени, составляющим не более 30% от предыдущего анализируемого интервала времени, в нашем примере это 0,3 мс.

Если же процесс является стационарным по математическому ожиданию и нестационарным по дисперсии, то оценку можно выполнить только по устойчивому параметру – математическому ожиданию. Собственно, поиск устойчивости временного ряда является одной из задач математической статистики. Но такой подход к решению задачи возможен далеко не всегда, чаще приходится принимать решение о значении параметра на интервале действия сигнала.

В этом случае стремятся получить информацию о помехе, действующей в канале, а именно оценить её плотность распределения вероятности. Обычно это можно сделать, если помеха является стационарным случайным процессом. Тогда задача сводится к случаю параметрической неизвестности, когда функциональный вид распределения y(t) известен, но неизвестно значение параметра сигнала, но известно, что параметр является элементом некоторого параметрического множества.

Чтобы выбрать решающее правило надо сравнить последствия различных решающих правил. При этом необходимо помнить, что минимизирующее потери решающее правило будет оптимальным лишь для данного конкретного значения параметра, но может оказаться весьма далеким от оптимального для другого значения параметра.

При отсутствии решающего правила, которое минимизирует потери для всех значений параметра, проблема выбора оптимального решающего правила является математически неопределенной, так как неясно, что подразумевать под наилучшим правилом. В этом случае предполагают, что сам параметр является случайным и имеет некоторое вероятностное распределение, заданное на множестве значений параметра. В этом случае полные средние потери равны математическому ожиданию на множестве значений параметра от математического ожидания по Y.

Из этих коротких примеров становится понятным, что чем большей информацией о сигнале и помехе мы располагаем, тем эффективнее принятое решение.

3

Следует заметить, что теория статистических решений очень близка по идеям и методам теории игр. Но отличается тем, что неопределенная ситуация не имеет конфликтной окраски, характерной для задач теории игр, где участники игры преследуют свои интересы.

В задачах теории статистических решений неопределенность ситуации зависит от объективной действительности, поведение которой неизвестно и считается не злонамеренным. На первый взгляд это упрощает задачу выбора решения, но нет, усложняет, так как в этом случае сложнее обосновать свой выбор, а значит и правильность решения. И выход здесь один - стараться извлечь как можно больше информации о сигнале и помехе.

2. Основные понятия, используемые для характеристики оценок

Итак, для оценки параметра λ мы располагаем только выборкой Y- у12,…,уn из наблюдаемой реализации y(t), причем выборка может быть минимальной. Оценка параметра λ рассматривается как некоторая функция выборочных данных Y(у12,…,уn,) то есть λ = f (Y). Любая функция f(у12,…,уn) от выборочных значений называется статистикой.

Функция f(у12,…,уn) вводится субъективно и определяется исследователем. Те значения параметра λ, которые получаются в результате той или иной статистики f(у12,…,уn) называются оценкой параметра λ. Для непрерывной функции y(t) это функционал f y t .

Принято считать, что функция f определяет решающее правило оценивания или алгоритм оценивания. Задача состоит в отыскании функции f при условии, что плотность вероятности выборочных данных W(Y/ λ) известна. Эта задача является основной в теории оценивания.

При этом желаемые свойства оценки параметра λ влияют на выбор преобразований функции f. Например, желательно, чтобы при каждом фиксированном значении параметра λ (например, при λ = λ0) плотность вероятности оценки W(λ/λ) имела вид узкого пика в окрестности λ0. Также очень желательно, чтобы оценка среднего значения параметра была несмещенной, то есть среднее значение распределения W(λ/λ) совпадало с истинным значением параметра. В этом случае дисперсия, характеризующая меру рассеяния оценки относительно среднего значения, даёт представление (при нормальном законе исчерпывающее) о качестве оценивания. Для смещённой оценки качество оценивания определяется средним квадратом отклонения от истинного значения параметра. Иногда распределение оценки W(λ/λ) не имеет дисперсии. Тогда для определения качества оценки фиксируют интервал, в центре которого находится

4

или истинное значение, или значение оценки параметра. Этот интервал называют доверительным. Для оценки качества определяют вероятность попадания оценки в доверительный интервал, которую называют доверительной вероятностью. Наилучшей будет та оценка, которая при заданном доверительном интервале имеет наибольшую доверительную вероятность. Оценка параметра считается состоятельной, если по мере увеличения объёма выборки n при любом доверительном интервале > 0 её доверительная вероятность стремится к единице.

3. Модель сигнала и помехи в задаче оценки параметра

Сигнал описывается некоторой функцией времени S t, и содержит параметры 1, 2 ,..., m , которые несут информацию о состоянии технического

объекта. Под объектом понимается любое устройство или система железнодорожной автоматики, телемеханики и связи, мониторинг, контроль и/или диагностику технического состояния которого требуется осуществлять.

Если используется гармонический сигнал, то S t, S t, ,u0 , u0 cos t , где частота , фаза , амплитуда u0 , могут

соответствовать определенным состояниям технического объекта.

 

Параметры

1, 2 ,..., m могут

быть

случайными,

или

детерминированными. Для детерминированных параметров задача оценки одного из них или группы параметров решается проще.

 

 

Если параметры

 

случайны, возможны два варианта: есть

(известна)

априорная информация о параметрах или её нет.

 

 

Если априорная информация о параметрах есть, то может быть определено

совместное

распределение

F l1,...,lm

значений параметров,

или

совместная

плотность

f l1,...,lm при непрерывных

значениях параметров

1, 2 ,..., m или

совместная

вероятность

P l1,...,lm при дискретных значениях

параметров

1, 2 ,..., m .

Сигнал, при распространении по каналу (цепи), подвергается действию

помех. Предположим, что в канале действует аддитивная помеха

 

y(t)=S(t, λ)+n(t) ,

0 ≤ t ≤ T.

(1)

вероятностные характеристики которой известны. Например, помеха n(t) представляет собой аддитивный белый гауссовский шум, одномерная плотность

5

распределения значений которой в любой момент времени подчиняется нормальному закону

 

 

 

 

 

 

 

x 2

 

 

 

 

 

 

1

 

2

 

 

 

 

 

 

 

 

 

 

f

n

(x)

 

 

 

e 2 n

,

(2)

 

 

 

2n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с математическим ожиданием M[n(t)]=0 и дисперсией n2 .

Известно, что спектральная плотность белого шума постоянна во всём

диапазоне

частот

F ( )

N0

,

 

 

 

, а корреляционная функция равна

 

 

 

 

 

 

 

 

 

n

2

 

 

 

 

 

R (t , t

)

N0

(t

 

t ) .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

n 1 2

2

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Если измерение происходит в фиксированные моменты времени с постоянным интервалом между отсчётами, то в результате на входе обрабатывающего устройства будут зафиксированы величины

 

 

 

 

 

 

y ti / S ti , n ti ,

 

 

 

 

(3)

где n ti

1

ti T

n t dt , S ti

,

1

ti T

S t, dt , y ti

/

1

ti T

y t / dt .

 

 

 

t

t

t

 

 

 

T

T

T

 

 

 

 

 

i

 

 

 

i

 

 

 

i

 

 

 

 

Выражения n ti , S ti , ,

y ti / представляют

собой

средние

значения

соответствующих величин на интервале ti ,ti T .

 

 

 

 

 

 

 

Значение дисперсии помехи Dn ti n2 на интервале

ti ,ti T равно

 

N0

вт .

 

2T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Многомерная плотность распределения помехи n(t) имеет вид

fn (x1, x2

,...,xn )

 

1

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

N

0

2

 

 

2

 

 

 

 

 

 

 

 

 

 

T

 

 

 

1

n

 

 

exp

 

xi2

T

(4)

 

 

N0 i 0

 

 

Рассмотрим распределение случайной величины y ti / , которая является функцией n ti , S ti , .

Из формулы (3) получим

n ti = y ti / - S ti , .

Используя плотность распределения n ti (4) для многомерного случая,

получим условную

плотность

распределения

выборочных значений

y1…ym

случайных величин

 

 

 

 

 

 

 

 

 

 

f y y1, y2 ,..., ym /

 

T n 2

 

 

1 n

2

 

 

 

 

 

exp

 

y ti / S ti ,

.

(5)

 

 

 

 

2

 

 

N0 i 1

 

 

 

Если в (5) устремить интервал дискретизации к нулю, то получим функционал правдоподобия:

6

 

1

T

y t / S t,

2

 

 

f y y(t / ) exp

 

0

 

dt

(7)

N0

 

 

 

 

 

 

Допустим, что совместная плотность f(y(ti),λ) распределения выборочных значений и параметров известна. Тогда согласно теореме умножения вероятностей совместная плотность f(y(ti),λ) определяется соотношением

fy ( y(ti ) ) fy ( y(t2 )) f y ( / y(ti )) f ( ) fy ( y(ti ) / )

(8)

Величины, входящие в выражение (8) имеют следующий смысл:

 

fy ( y(ti ))

- безусловная плотность распределения выборочного

 

значения случайной величины y(ti).

 

f y ( / y(ti ))

- условная плотность распределения параметров λ, если

 

известна величина y(ti) или апостериорная плотность

 

распределения

 

f ( )

- безусловная плотность распределения параметров.

 

fy ( y(ti ) / )

- условная плотность распределения выборочного значения

 

y(ti), рассматриваемая как функция λ и называется функцией

 

правдоподобия.

 

4. Методы оценки параметров сигналов

Результаты измерений y(t1),y(t2),…,y(tn) образуют выборку Y: у12,…,уn, зависящую от истинного значения параметра λ.

Поскольку выбор функции f(у12,…,уn) субъективен, то существуют различные методы оценки параметров λ. Эти методы определяются

исследователем в зависимости от существующих сведений о параметре λ и

желательных свойств оценок .

Из формулы (8) видно, что параметр λ входит в соответствующие плотности распределения. И в зависимости от используемого распределения получим тот или иной метод оценки параметра распределения.

Наиболее распространены следующие методы оценки.

1.Оценка по минимуму среднеквадратичной погрешности.

2.Оценка по максимуму апостериорной вероятности.

3.Оценка по максимуму функции правдоподобия.

4.Оценка по критерию Байеса.

4.1.Оценка по минимуму среднеквадратичной погрешности

При оценке по минимуму среднеквадратичной погрешности минимизируется выражение:

7

 

2 f

 

y

 

y t d

(9)

 

 

 

 

 

 

 

 

 

 

Для получения оценки необходимо взять первую производную от (1.2.1.) по

 

 

 

 

 

 

 

 

 

 

 

 

 

и, приравняв ее к нулю, решить конкретную систему.

 

 

 

 

 

 

 

 

 

 

 

Если вторая производная от (9) по больше нуля, то полученные значения

 

 

 

 

 

 

 

 

 

 

 

 

 

обеспечивают минимум (9).

 

 

 

Для одномерной величины в качестве оценки получим

 

 

 

 

 

 

 

f(y(t))= = f

 

y

 

y t d

(10)

 

 

 

 

 

 

 

 

 

 

4.2. Оценка по максимуму апостериорной вероятности

 

 

 

Допустим, что апостериорная плотность распределения f

 

y

 

y t является

 

 

 

 

 

одномодальной функцией и имеет максимум при истинном значении параметра

λm. Если в качестве критерия взять оценку m, обращающую в максимум

апостериорную плотность распределения, то такой метод оценки называется методом максимальной апостериорной вероятности. Преобразуя формулу (8) получим

f

 

y

 

y t

=

f ( )

f y

 

( y(t)

 

)

(11)

 

 

 

 

 

 

f y ( y(t))

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

y t

 

 

 

 

 

m: max f

 

 

 

 

 

 

 

 

 

 

 

 

 

или

 

d

f

 

 

y

 

y t

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

d

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для упрощения вычислений используют логарифм апостериорной плотности распределения т.к. логарифм монотонно возрастающая и однозначная функция своего аргумента. Тогда имеем

d

ln f

 

y

 

y t 0

(12)

 

 

d

 

 

 

 

 

 

 

4.3. Оценка по максимуму функции правдоподобия

Метод максимального правдоподобия применяется в тех случаях, когда апостериорная плотность распределения неизвестна, и приходиться использовать ту информацию, которая заключена в реализации y(t). В частных случаях метод впервые был применён К. Гауссом; как общий метод был предложен американским статистиком Р. Фишером в 1912 г.

8

При его использовании в качестве оценки принимается величина ,

максимизирующая функционал правдоподобия. Это будет наиболее вероятное значение параметра λ.

max ln f y

 

( y(t)

 

) или

d

ln f y / ( y(t)

 

)

0

(13)

 

 

 

 

 

d

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Как видно из формул (11) - (13) при равномерном распределении параметра λ методы максимизации апостериорной вероятности и максимума правдоподобия идентичны.

 

4.4. Оценка по критерию Байеса

 

 

 

 

 

 

 

 

Наиболее общим является критерий Байеса. Положим, за уклонение оценки

от истинного значения λ вводится некоторая

функция потерь с(λ, ). Эта

функция

 

 

 

 

 

достигать

минимума

 

 

 

 

с

с(λ, ) должна

 

когда = λ и возрастать

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

увеличением разности |λ– |. Вводится эта функция субъективно и в литературе

приведены примеры

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с(λ, )= (λ– )2; с(λ,

)=a0-δ(λ– ),

 

 

 

 

 

 

 

 

где a0– произвольная постоянная,

 

 

δ(х) – дельта-функция.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Средние потери при зафиксированной реализации y(t) и оценки будут

иметь вид

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

c( | y(t)) ... c( , ) f

 

y

 

y t d

 

 

 

 

 

 

 

 

(14)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

полные потери или средний риск вычисляются по формуле

 

 

 

R( ) c( )

f y ( y(t)) ... c( , ) f

 

y

 

y t d dy

 

 

 

 

 

(15)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( y )

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

y t вычисляется

 

 

где

апостериорная

 

 

плотность

распределения f

 

 

по

 

 

 

 

 

 

 

 

 

формуле (11).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Оценка ,

минимизирующая средний риск

R( ), называется байесовской

оценкой. Из формулы (15) видно, что достаточно минимизировать условный риск

(14)

 

 

 

 

 

 

y t d

 

 

 

 

 

 

 

min c( | y(t)) ... c( , ) f

 

 

 

(16)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В зависимости от функции потерь с(λ,

) будем иметь различные методы

оценки параметра удовлетворяющие (16).

На практике наиболее часто применяют метод максимума правдоподобия.

9

5. Характеристики оценок

 

 

 

 

 

 

 

 

 

 

 

Так как оценка является функцией выборочных значений y(t), она будет

случайной величиной. Основными

характеристиками,

определяющими

 

 

 

 

 

 

практическую ценность оценки =f(y(t)), являются:

 

 

 

 

 

 

 

 

 

1. Несмещённость оценки. Оценка

 

называется несмещённой,

 

если

 

 

 

 

 

математическое ожидание оценки равно истинному значению параметра

т.е.

М T = λ

 

 

 

 

(17)

Как видно для несмещённой оценки

формула (17)

выполняется

при

произвольной длительности сигнала Т. Однако на практике при конечной длительности сигнала Т условие (17) нарушается и выполняется при Т → ∞. О

такой оценке говорят, что она асимптотически несмещённая. Если формула (17)

нарушается, то появляется смещение.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

∆= М Tn – λ

 

 

 

(18)

Величину

погрешности

при

оценке

параметра характеризуют

 

 

 

 

 

 

 

 

среднеквадратическим отклонением оценки от истинного значения

 

 

 

 

 

 

 

 

 

 

ε2= М( Tn – λ)2

 

 

(19)

и дисперсией оценки

 

 

 

 

 

 

 

 

 

 

)2

 

 

 

D = М(

Tn

–М

Tn

(20)

 

 

 

 

 

 

используя (18), (19) получим

 

 

 

 

 

 

 

ε2= D + ∆2

 

 

(21)

 

 

 

 

 

 

 

Как видно

из формулы

(21) для

уменьшения погрешности

оценки ε2

необходимо получить несмещённую оценку (∆=0) и уменьшить дисперсию оценки D

2. Состоятельность оценки. Эта характеристика зависит от количества отсчетов при дискретной выборке или времени действия сигнала Т, при непрерывной реализации случайного сигнала y(t).

Оценка параметра будет состоятельной, если она сходиться по вероятности к оцениваемому параметру, т.е.

 

lim P( Т ) ) =0

(22)

 

Т

 

 

 

 

Согласно неравенству Чебышева

 

 

 

 

 

P( Т

) )

D Т

(23)

2

 

но

 

 

 

 

 

D

= М( –λ)2 .

(24)

Т

T

 

10

Соседние файлы в предмете Теория передачи сигналов