
книги / Модели непрерывных каналов связи на основе стохастических дифференциальных уравнений
..pdfРассмотрим систему СДУ типа уравнений Навье—Стокса [64],
описывающих векторное поле y{t, |
/*) = [#!(/, /•), |
yn(t, г ) ] т: |
||||
|
и |
Jjfk |
ЬУь(‘ - r)+ J ] a, |
&»k |
k=z\, 2, |
|
dt |
' 2 j У 1' |
drj |
drjdt= $(*./•), |
n\ |
||
|
|
|
/=i |
|
|
(4.3.17) |
|
|
|
|
|
|
|
где |
Д = -^ —+ . . . + —— —оператор |
Лапласа. |
|
|
||
|
dr2, |
|
dr21 |
|
|
|
Здесь уже потребуется использовать преобразование Фурье по |
||||||
/+ 1 |
переменным |
t, Г\, ...» п. Применяя его к СДУ (4.3.17) |
анало |
гично тому, как это было сделано выше в двумерном случае, по лучаем для спектральных амплитуд поля уравнение
i » + |
S(О V/)! + |
a, (i a,) (i v,)] 1 У, (к) + |
|
||||
|
/=1 |
|
|
|
) |
|
|
S iv / J |
Yi (rri)Yq( k - m ) d m = |
Eq{k), |
(4.3.18) |
||||
/ = 1 |
— 00 |
|
|
|
|
|
|
где к=(со, vi, ..., Vi), |
q = 1, 2, |
..., |
я. |
Для |
характеристического |
||
функционала |
|
|
00 |
|
|
|
|
|
|
I |
п |
|
|
|
|
Ф [у (k)] = |
1S |
|
|
|
|||
М exp < i |
—00 <?=1М |
к) У<? |
|
|
|||
|
|
|
|
|
получаем систему уравнений, аналогичную (4.3.14). Решая ее, на ходим Ф [у (к)] и по нему— моментные функции спектральных ам плитуд поля. Если моментные функции высших порядков можно считать близкими к нулю, то для корреляционной функции спек тральных амплитуд получается простое выражение
_________ S (k ,-k a) |
|
(4.3.19) |
||
В { К к .)= = 4 ' |
I |
Т » |
||
|
||||
(Ь ,)Ч |
io', |
v/») |
|
|
|
/=| |
|
|
|
где v = (v n , V21, .... v/i). В противном |
случае |
необходимо учиты |
вать взаимную зависимость моментных функций, которая сильно усложняет их определение.
Корреляционная функция самого поля y(t, г) определяется по £ (к ь кг) так же, как это было сделано выше. Синтез квазилиней ных моделей осуществляется аналогично линейным.
4.4. ИССЛЕДОВАНИЕ МОДЕЛЕЙ РАЗРЫВНЫХ СЛУЧАЙНЫХ ПОЛЕЙ
Для случайных полей в каналах связи, как и для случайных процессов (сМ. гл. 3), не всегда приемлемы непрерывные модели. Импульсные помехи, распределенные в пространстве, и некоторые виды ПВ сигналов в каналах связи следует рассматривать как разрывные случайные поля. Моделями таких полей могут служить
9* |
131 |
СДУ в частных производных тех же видов, что рассмотрены в §4.2 и 4.3, с тем лишь отличием, что вместо белого шума £(/, г) в ка честве возбуждающего воздействия рассматривается пуассоновская последовательность распределенных в пространстве дельта-им пульсов
■q(t, r) = E i4 ft8 ( f - f A)8(r — rk)
Я
с векторами «амплитуд» А *, имеющими плотность вероятности р(Аъ). Эта последовательность характеризуется некоторой интен сивностью (средним числом импульсов в заданной ПВ области) \л, а действительно появляющееся число импульсов представляет собой случайную величину, распределенную по закону Пуассона [106, 127]. Будем в дальнейшем называть поле такого вида пуас соновским.
В общем случае СДУ с воздействием в виде пуассоновского поля порождает некоторое разрывное поле x(t, г). Рассмотрим мо дели разрывных полей в форме СДУ первого и высших порядков.
4.4.1. СДУ первого порядка
Рассмотрим СДУ
■ ^ ^ = f ( x ) S ^ |
f L lL + , ( x ) + ii( / ' г)' |
(4 А 1 ) |
/=1 |
; |
|
аналогичное по виду (4.2.1), с оператором (4.2.2). Здесь т](^, г) — пуассоновское поле.
Разрывное случайное поле, определяемое (4.4.1), является мар ковским по времени (см. § 1.4), и его плотность вероятности удов летворяет некоторому уравнению, обобщающему уравнение Колмо горова— Феллера. При F(x)={30I это уравнение можно записать в виде
i
|
|
dw(x, t, |
г) _ |
^ |
dw(х , t, г) _ |
|
|||
|
|
|
|
dt |
|
^ |
дг, |
|
|
|
|
|
|
|
/=1 |
' |
|
|
|
П |
|
|
|
|
00 |
|
|
|
|
— |
[fft(x)uy(x, |
t, |
T)]-{-vA J |
p (A )w (x — \, t, T)dk — vAw{x,t,T). |
|||||
k=l |
* |
|
|
|
—oo |
|
|
(4.4.2) |
|
|
|
|
|
|
|
|
|
|
|
Краевые условия |
для |
(4.4.1) |
аналогичны |
тем, |
что задаются |
||||
для уравнения |
(4.2.3). |
|
|
|
|
|
|
||
Если |
F(x) |
является скалярной |
функцией |
вида |
F(x) = p ix -j-p 0» |
||||
то вместо (4.4.2) справедливо уравнение |
|
|
|||||||
|
d w (x ,t,r ) __Q |
dw(x,t,r) |
■£rlf (x)w(x, |
t, r)] + |
|||||
|
dt |
" Р |
0 |
dr |
|
||||
|
|
|
|
|
132
^ “ ■ £ ■ [ ^ 1 |
^ .(М> г) |
|
j |
p(A)w(x — A, t, r)dA |
||
L |
—oo |
J |
—oo |
|
||
|
|
— vAw (x , |
t, |
r), |
(4.4.3) |
|
аналогичное |
(4.2.4). |
(4.3.1) |
можно |
записать статистически |
||
Как и для |
(4.2.1), для |
эквивалентное ему в рамках описания одномерными распределе ниями и корреляционными функциями СДУ типа (4.2.5), в кото рое вместо |(/, г) входит т](/, г).
Решение уравнения (4.4.3) в стационарном и однородном ре жимах аналогично решению УКФ, рассмотренному в гл. 3. Одно родное (но не обязательно стационарное) решение Wo(xy t) также находится методами теории разрывных марковских процессов, опи санными в гл. 3. Стационарное решение wcт(х, г) уравнения (4.4.3), как и в разд. 4.2.1, может быть найдено двумя способами: в эксцессном приближении и путем сведения его к дифференци альному уравнению для функционала от wcт(х, г).
Первым способом решение получается та^ ж е, как в разд.
4.2.1, с тем лишь отличием, что теперь К = уаА2, а £>4= —\аАа/4а. Второй способ рассмотрим подробнее. Учитывая, что ищется стационарное решение, т. е. dw (х, /, r ) f d t = 0 и полагая f { x ) = —ах,
вводим функцию
00 00
s(v, и) = ~ |
Г Г wc(x, r)eHm+''n dxdr. |
—00 —00 Из (4.4.3) получаем для этой функции уравнение
— i wp0s (v, и) = — |
“I + |
|
+ « , r * ^ f i + i l b J l j + V j(S (0i и)[вл(0) _ 1]. |
(4.4.4) |
где 0л (я)— характеристическая функция распределения р(А). Решение уравнения (4.4.4) имеет вид
s(v, и) = С ехр
а~ *л1ед(р) ~ П —ittPo
aV —
Подставляя в полученную формулу то или иное конкретное вы ражение 0л (и) и выполняя обратное преобразование Фурье по v и и, можно найти плотность вероятности адСт(*, г).
Синтез СДУ (4.4.1) при Т7 (л:) =pijc-f-p0 по заданной плотности вероятности wc.0(x) и корреляционной функции /С*(т, р) или спек тру £/х(й), v) может быть осуществлен методами, аналогичными
рассмотренным в гл. |
3. |
Пусть, например, |
р (Л )= £ (Л —Л0). Тогда функция /(.*) в СДУ |
отыскивается по (3.2.26), а Ао может быть найдено с использова-
133
нием соотношения
оо |
- 1/2 |
|
/* (■*) wn (x)dx |
Если vx^>l, то поле близко к непрерывному и справедливы все соотношения разд. 4.2.2.
4.4.2. СДУ высших порядков |
|
|
Рассмотрим СДУ |
|
|
Р'игУУ, г )= т !(/, г), |
(4.4.5) |
|
аналогичное по виду (4.3.1), где |
т](£, г)— пуассоновское |
поле. |
Если оператор ST\,г имеет вид |
(4.3.2), то, поступая так же, как |
в разд. 4.3.1,,получаем для характеристического функционала спек тральных амплитуд поля уравнение
fW^ - 1 я.им- ^ - "У.1,- в| +
+ |]<-О1V. Ф[.(к)) [ у1~ V |
(4.4.6) |
/=2 |
|
являющееся аналогом УКФ. Из него, так же как и в случае не прерывного поля, находим выражение корреляционной функции спектральных амплитуд:
в { К к ,)= - |
v ,4 2 |
(4.4.7) |
5 (к ,— кг). |
||
|
2 I F(к,) |
|
которое отличается от (4.3.8) только постоянным множителем. Та кое совпадение объясняется тем, что в обеих моделях (непрерыв ной и дискретной) заданы дельта-коррелированные воздействия.
Соображения относительно факторизации корреляционной функции, изложенные в разд. 4.3.1, остаются справедливыми и здесь.
Что же касается квазилинейных и нелинейных СДУ, то для описываемых ими полей также можно получить уравнения харак теристических функционалов в вариационных производных, одна ко решение их в аналитическом виде затруднено. В гауссовском приближении корреляционную функцию можно определять по фор муле вида (4.3.16).
Если предположить, что не только воздействие, но само поле
y(t, |
г) является пуассоновским, т. е. V X= V A , т о при |
анализе моде |
лей |
разрывных полей в форме СДУ (относящихся |
к классу ли |
нейных) для определения корреляционной функции можно вос пользоваться и другим подходом: предварительно получить на ос нове СДУ модель поля в интегральной форме (1.2.1), т. е. найти импульсную переходную характеристику формирующего фильтра
134
Н(т, р) (функцию Грина). Через нее корреляционная функция по ля аналогично тому, как это было сделано в § 4.3, выражается весьма просто:
К у (т , Р) —
J J Н(/, r)HT(i+ x, r+ p)drdt. (4.4.8)
-oofe
Выражения функций Грина известны для многих видов уравне ний в частных производных [18, 52, 139].
Глава 5
и д ен ти ф и к ац и я , оцени вание и
ОБНАРУЖЕНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ И ПОЛЕЙ В КАНАЛАХ СВЯЗИ С ИСПОЛЬЗОВАНИЕМ МАРКОВСКИХ МОДЕЛЕЙ
5.1. ЗАДАЧИ И МЕТОДЫ ИДЕНТИФИКАЦИИ МОДЕЛЕЙ СЛУЧАЙНЫХ ПРОЦЕССОВ И ПОЛЕЙ
5.1.1. Содержание задач идентификации и оценивания
При построении моделей случайных процессов и полей в кана лах связи наряду с синтезом по известным вероятностным харак теристикам, рассмотренным в гл. 2—4, возможен и другой подход, основанный на методах идентификации динамических систем и предполагающий определение параметров модели путем непосред
ственной |
обработки наблюдаемых реализаций |
сигналов и помех |
в канале. |
О взаимосвязи этих двух подходов, |
их преимуществах |
и недостатках говорилось в § 1.6. По сравнению с синтезом иден тификация в меньшей степени связана с какими-либо априорными допущениями о характеристиках моделируемого процесса или по ля, позволяет более гибко приспосабливать модель к их измене ниям и вести на ее основе обработку сигналов в реальном масшта бе времени, что очень важно, когда речь идет о каналах связи. Вместе с тем знание результатов синтеза может существенно об легчить и упростить процедуру идентификаций.
К настоящему времени разработаны многочисленные методы идентификации динамических систем различной физической при роды, в том числе и с распределенными параметрами [34, 45, 109, 115, 121, 161]. В общем случае идентификация осуществляется в условиях априорной неопределенности относительно не только параметров модели, но и самой ее структуры. Однако на практике для большинства объектов те или иные физические соображения позволяют ограничиться поиском модели в рамках структур опре деленного типа или даже одной структуры, предполагая неизвест ными только некоторые ее параметры. Как отмечалось ранее, та-
135
кой структурно-детерминированный подход может быть принят и при описании каналов связи.
Применительно к каналам связи задача идентификации на практике чаще всего ставится как задача измерения их импульс ных переходных характеристик или передаточных функций по ре зультатам наблюдения выходных сигналов при известных или ча стично известных сигналах на входе в условиях аддитивных помех. В первом случае измерения осуществляются по откликам на спе циальные зондирующие сигналы, во втором— по информационным сигналам (при передаче дискретных сообщений форма элементов сигнала на входе обычно известна, но их последовательность слу чайна). Подобные методы идентификации, в том числе и для ПВ каналов, подробно описаны в [56, 57, 156].
Иначе обстоит дело с задачами идентификации феноменологи ческих моделей, которые, как отмечалось выше, являются основ ными при описании аддитивных помех и случайных системных ха рактеристик каналов. Особенность их в том, что они описывают некий гипотетический механизм формирования случайного процес са или поля, не обязательно соответствующий реальному физиче скому механизму, поэтому входные сигналы таких моделей также являются «виртуальными» и принципиально недоступны наблюде нию. С точки зрения возможности наблюдения такие модели вооб ще не имеют входов, и их возбуждающие воздействия (обычно это белый шум) следует рассматривать как внутренние сигналы.
Конечно, существует немало реальных объектов, входы кото рых недоступны наблюдениям по чисто техническим причинам. Поэтому разработаны и такие методы идентификации, которые не требуют наблюдения входных сигналов и, следовательно, могут быть применены и к феноменологическим моделям случайных сиг налов и помех. Однако арсенал их значительно беднее по сравне нию с идентификацией «по входу и выходу», а возможности более скромные.
В указанных выше условиях, т. е. при наличии априорной ин формации о структуре модели и недоступности для наблюдения ее входных воздействий, задача идентификации сводится к оцени
ванию параметров 0 модели случайного процесса или |
поля у (t, |
г; 0)по наблюдениям его реализаций в смеси с шумом |
|
z (t , г)—у (t, г, 0 )+ п (*, г). |
(5.1.1) |
Под оценкой параметров 0 понимают такой вектор их значений
0, который минимизирует некоторый показатель, характеризующий отклонение оценок от истинных значений параметров и определяе мый в общем случае с учетом различной роли разных ошибок и априорного распределения параметров.
При оценке случайных параметров наиболее общим из таких показателей является так называемый средний байесовский риск или соответствующий ему «апостериорный риск» [22, 80, 84, 86,
136
121, |
122, |
126]: |
|
|
|
|
|
Я = |
00 |
z)fifO, |
(5.1.2) |
|
|
j C{Q, 0)ш(0 I |
|||
|
|
—00 |
|
|
|
где до(0|г) — апостериорная плотность |
вероятности параметров, |
||||
связанная с априорной |
плотностью |
ш(0) |
формулой Байеса; |
с(0, 0 )—цена ошибок или функция потерь.
Чаще всего рассматривается так называемая простая функция потерь
с(0, 0) — с0 — 8(0 — 0), где с0> 0 —константа, и квадратичная
c{Q, 0) = (0 - 0)r S(0 — 0),
где S—некоторая неотрицательно определенная матрица.
В случае простой функции потерь минимум (5.1.2) достигается при
0'=argmaxtiy(O | г), |
(5.1.3) |
0 |
|
т. е. при таких значениях параметров, которые доставляют макси мум соответствующей апостериорной плотности вероятности. При. квадратичной функции потерь оптимальной оценкой является, условное среднее по упомянутой апостериорной плотности
00
0 = J Ош (0 ! Z) AO. —’ЭС
Для равномерного априорного распределения ш(0) (5.1.3) рав ноценно требованию максимума функции правдоподобия ш(г|0). Последняя, однако, существует лишь для дискретной выборки, а при переходе к непрерывной теряет смысл. Поэтому в общем слу чае рассматривают отношение правдоподобия (ОП)
1(0) = w(г |0) |
(5.1.4) |
т{г |0О) |
’ |
где 0о—вектор некоторых фиксированных значений параметров. В случае непрерывной выборки также часто используют выра
жение (5.1.4), но при этом его уже следует понимать как услов ную запись предела отношения соответствующих плотностей веро ятностей при бесконечном «сгущении» точек наблюдения. Матема тически строго ОП определяется как производная одной вероятно стной меры по другой—так называемая производная Радона — Никодима [86]
Л(0) __ dP(г 16) dp{z\ е0)‘
Для того чтобы она существовала и указанная предельная про цедура имела смысл, соответствующие вероятностные меры долж ны удовлетворять условию взаимной абсолютной непрерывности
137
(регулярности). Случаи, когда оно нарушается, будут оговорены ниже особо.
Оценки
0 = argm axA(0) |
(5.1.5) |
называют оценками по правилу максимального правдоподобия (оценками МП). Наряду с задачами, в которых априорное рас пределение параметров можно полагать равномерным, оценки МП широко используются в тех случаях, когда искомые параметры во обще нельзя считать случайными величинами с известным'и рас пределениями вероятностей и, следовательно, байесовский подход неприменим.
Во многих практических задачах оценки, оптимальные по одно му критерию, сохраняют оптимальность (или близки к оптималь ным) н по другим критериям.
Задачи оценивания параметров сигналов возникают не только при идентификации их моделей, но и при решении многих прак тических вопросов обработки сигналов в радиолокации, связи, из мерительной технике и других областях. Так, задача приема дис кретных сообщений сводится к различению сигналов с разными •значениями информационного параметра 0 из некоторого дискрет ного множества, а задача приема (демодуляции) непрерывных соЬбщений— к оцениванию непрерывного информационного парамет ра 0 (/), изменяющегося во времени, а иногда и в пространстве. В частном случае в качестве такого параметра может выступать сам сигнал (поле) у(/, г)=0(£ , г). При этом оценивание его обес печивает фильтрацию, сглаживание или предсказание сигнала. Оп тимальные оценки ожидаемых сигналов используются при постро ении алгоритмов оптимального приема дискретных сообщений в стохастических каналах.
Применительно к сигналам, зависящим только от времени, пе речисленные задачи достаточно подробно исследованы и освещены в [22, 80, 126 и др.)]. Для ПВ сигналов (полей) они изучены пока гораздо слабее. Кроме того, в большинстве случаев в этих задачах для сигнала у (t, г, 0) либо принимается простейшая модель в виде явного аналитического выражения, в которое при необходимости вводят помимо оцениваемых параметров 0 некоторые сопровожда ющие параметры (примером могут служить задачи .оптимальной демодуляции), либо рассматривается произвольный нормально флуктуирующий сигнал (что характерно для задач радиолокации) [22, 57, 60, 80, 126].
В рассматриваемой здесь задаче идентификации для наблюдае мого поля y (tt г, 0) задаются более сложные, в общем случае не гауссовские модели в форме СДУ одного из видов, приведенных в § 1.4. Одно из отличий задач идентификации таких моделей от задач их синтеза, рассмотренных в гл. 2 и 3, заключается в том, что априорная информация о моделируемом процессе ограничива ется указанием типа порождающего его СДУ. Разумеется^ полнота
138
ее может быть разной: порядок ОДУ (т. е. размерность вектора состояний) п обычно целесообразно задавать априори или опреде лять с использованием процедур, описанных в гл. 2—4, но иногда он может предполагаться произвольным и определяться в процес се идентификации [53, 110]; для нелинейных функций, входящих в СДУ, могут быть заданы определенные аналитические выраже ния, содержащие неизвестные параметры, или же оставлена сво бода их выбора в процессе идентификации и т. п.
Математические основы теории оценивания негауссовских слу чайных процессов, представленных стохастическими дифференци альными уравнениями, заложены в [49, 130, 133, 135 и др.]; позд нее предложены некоторые обобщения этих результатов на слу чайные поля [4, 188— 192, 197, 198]. Методы оценивания парамет ров таких моделей по сравнению с оцениванием состояний развиты слабее [53, 110, 11, 121]. Особенно это касается параметров СДУ в частных производных, описывающих случайные поля. По этому в данной главе основное внимание уделяется именно таким моделям. Алгоритмы идентификации моделей случайных процес сов могут быть получены как частные случаи рассмотренных ниже алгоритмов идентификации полей, если в них не учитывать про странственные координаты г.
5.1.2. Математическая постановка задачи идентификации СДУ
Рассмотрим задачу идентификации моделей случайных процес сов и полей в форме СДУ, придерживаясь структурно-детермини рованного подхода, о целесообразности которого уже говорилось выше, т. е. будем считать, что заданы СДУ определенного вида, содержащие некоторые неизвестные параметры 0:
^?,гУ(^ г) = К*> г)> |
(5-1.6) |
где tft.r — некоторый дифференциальный, в общем случае матрич
ный оператор по временной и пространственным координатам, за висящий от 0; |(/, г) —гауссовское поле с известными моментными функциями
Mi(f. г) = 0, М \(t. r)lT(z. р) = К%(t, X, г, р). |
(5.1.7) |
Предполагается, что структура оператора^:® г , включая сведе-
ния о наивысшем порядке производных, установлена на основе тех или иных физических соображений либо с использованием мето дов, изложенных в гл. 2—4. Разумеется, считается известным так же число скалярных компонент т моделируемого поля у(/, г).
Здесь и в дальнейшем будем полагать, что параметры модели 0 являются неизвестными, но не случайными, т. е. при всех реали зациях поля у (t, г) одинаковы. Стохастические дифференциальные уравнения со случайными коэффициентами образуют особый, го раздо более сложный класс стохастических моделей [45], иссле дование которого выходит за рамки рассматриваемых здесь задач.
139
При оценивании таких параметров, как следует из разд. 5.1.1, наи более подходящим является правило МП. Его и будем использо вать в дальнейшем, если не оговорено иное.
Наблюдениям доступны реализации |
поля у (t, г) |
в области |
пространства Q на интервале времени [О, Т] в аддитивной смеси |
||
z(t, r ) = y Q(t, r )+ n (f, |
г)' |
(5.1.8); |
с шумом п(£, г), который будем считать векторным полем с нуле
вым средним, М п(/, г )= 0 |
и известной корреляционной матрицей |
|
M n (t, |
r)nT(x, р) = Кn(t, х, г, р). |
(5.1.9) |
Указанные реализации в силу (5.1.6) зависят от параметров модели 0, что подчеркивается обозначением уе(£, г) в (5.1.8).
Таким образом, задача идентификации модели случайного по ля в форме СДУ (5.1.6) состоит в следующем: по наблюдениям его реализаций в смеси с шумом (5.1.8) в области [О, Г ]Х Й необ
ходимо определить значения 0 параметров 0, доставляющие ма ксимум ОП (5.1.4).
5.1.3. Методы идентификации
Для практического осуществления идентификации модели поля Уе(/, г) необходимо синтезировать алгоритм, в соответствии с ко торым должны обрабатываться наблюдаемые его реализации при
получении оценки 0. Обычно такой синтез включает в себя два этапа: вывод аналитического выражения ОП и его максимизацию по 0. Представлять искомую оценку в виде явного аналитического выражения при этом не всегда возможно и целесообразно, неред ко достаточно построить сходящийся к ней итерационный процесс.
Выбора метода идентификации зависит от типа СДУ и степени влияния шума наблюдений. Если заданы уравнения состояния, на пример вида (1.4.30), а все компоненты вектора состояния доступ ны наблюдению и шумом наблюдений можно пренебречь, то уда ется найти и их производные. Это позволяет рассматривать реа лизации левой части уравнений состояния как косвенно наблюдае мые. Тогда, если шум модели |{t, г) гауссовский, нетрудно запи сать соответствующее отношение правдоподобия, из которого сле дует, что задача идентификации по правилу МП сводится к наи лучшему среднеквадратическому приближению производной век тора состояния правой частью уравнения состояния, содержащей искомые параметры 0.
Этот подход, получивший название метода дифференциальной аппроксимации и применительно к моделям случайных процессов освещенный многими авторами, например [121], может быть обоб щен, как показано в разд. 5.2.1, и на случайные поля, описываемые СДУ общего вида (1.4.30) в частных производных.
Получение оценок МП параметров СДУ при наличии аддитив ного шума наблюдений осуществляется просто только в случае ли-
140