Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Пугачев, В. С. Основы статистической теории автоматических систем

.pdf
Скачиваний:
36
Добавлен:
22.10.2023
Размер:
12.95 Mб
Скачать

выразим вероятность ошибки системы как функцию входного и

.выходного сигналов системы:

Рош (X, У) = х [ql (Y, 0) + pi (Y, I) Q (X)].

(12.58)

Для определения коэффициента х подставим выражение (12.56). плотности вероятности случайного вектора U в формулу (12.44). Тогда получим

х = [<7 + pQ (X)]-1.

Подставив это выражение в формулу (12.58), получим

Рош (^i

уч _

д Ц У , 0) + р Ц У , 1) Q (X)

(12.59)

1

g + pQ(X)

 

 

Полагая здесь сначала Y = 0, а затем У = 1 и принимая во внимание (12.54), получим следующие выражения для вероятности ошибки системы при двух возможных значениях ее выходного сигнала У:

 

 

pQ (X)

Рош (^0 1)

 

я

 

(12.60)

 

Рош(Х,

0) = я + pQ (X) ■'

я + pQ (X)

Из этих формул видно,

что оптимальная система должна давать

нулевой

выходной сигнал

У =

0, ерли pQ (X)

< q,

и выходной

сигнал,

равный

единице,

У = 1,

если pQ (X)

>

q.

и сравнения

Заметим, что

вместо вычисления величины

Q (X)

ее с некоторым порогом можно вычислить любую возрастающую функцию величины Q (X). Это позволяет во многих случаях зна­ чительно упростить оптимальную систему обнаружения. Обозна­

чим через 0 (г)

какую-нибудь возрастающую функцию.

Тогда алго­

ритм оптимальной системы можно выразить формулами

 

У* =

0,

если

0 (Q (X)) <

с,

 

 

У* =

1,

если

0 (Q (X)) >

с,

(12'61)

где порог с определяется формулой

 

 

 

 

c = 0 ( J L ) .

 

(12,62)

Найденный алгоритм работы оптимальной системы обнаружения

молено коротко

записать

в

виде

 

 

 

 

У* = 1

(0 (Q (X)) - с ) ,

 

(12.63)

"где 1 (0) — единичная ступенчатая функция, равная единице при положительном аргументе и нулю при отрицательном аргументе.

Формулы (12.60) определяют условную вероятность ошибки при данном входном сигнале и данном выходном сигнале системы.- Однако для оценки качества системы обнаружения эта вероятность дает немного. Обычно принято характеризовать качество системы обнаружения вероятностью пропуска сигнала и вероятностью лож­ ной тревоги.

341

Вероятностью пропуска сигнала называется вероятность того, что система «не заметит» полезный сигнал, присутствующий во, входном сигнале. Вероятностью ложной тревоги называется вероят­ ность того, что система выдаст сообщение о наличии полезного сигна­ ла, когда в действительности он отсутствует во входном сигнале.

Для вычисления вероятности пропуска сигнала и вероятности

ложной тревоги

введем

случайную величину

 

 

 

 

V = О (Q (X)).

(12.64)

Тогда вероятность пропуска сигнала

 

 

Рпр.с =

P ( Y *

=

0 | У Т =

1) =

P ( V < с | 7 т =

1),

и вероятность ложной

тревоги

 

 

 

р л . т =

Р ( У *

=

1 I У т =

0 ) =

Р ( V > с | У т =

0 ) .

Пусть gx (v) — условная плотность вероятности случайной ве­ личины V при наличии полезного сигнала, т. е. при любом отлич­ ном от нуля значении вектора U, a g 0 (v) — условная плотность вероятности случайной величины V при отсутствии полезного сиг­ нала, т. е. при нулевом значении случайного вектора U. Тогда вероятность пропуска сигнала и вероятность ложной тревоги выра­ зятся формулами

Рпр. с = JС§1 («) dv> Рл.т =

J0 0

go (v) dv.

(12.65)

О

с

 

и gy (v)

Определение условных плотностей вероятности g 0 (v)

в общем случае представляет очень сложную задачу. И лишь в част­ ных случаях, когда входной сигнал представляет собой нормально распределенную случайную функцию и зависимость (12.64) можно линеаризовать, т. е. выразить случайную величину V как результат линейного преобразования входного сигнала X (т), задача приб­ лиженного определения плотностей вероятности gQ(v) и g x (v) ре­ шается сравнительно просто. В этом случае условные распределения случайной величины V при наличии и отсутствии сигнала можно считать приближенно нормальными. Тогда для определения плот­ ностей вероятности g 0 (v) и g x (v) достаточно найти соответствую­ щие условные математические ожидания и дисперсии случайной величины V. Приближенное определение вероятности пропуска сигнала и вероятности ложной тревоги сведется в этом случае к эле­ ментарным вычислениям с применением таблицы функции Лапласа.

В некоторых случаях задача определения вероятности пропуска

сигнала

и вероятности ложной тревоги может быть решена сравни­

тельно

просто, если входной

сигнал

зависит линейно от параметров

U1, ...,UN. В этом случае

 

формула

(12.57)

принимает вид

 

 

СО

|

со

1•, • |•

•,иыЛ)(« х

 

 

 

Q (X) — — со

— со

 

 

 

X exp{ {2N u rz r ~

 

N

dut

d u7V>

( 12.66)

 

,r=1

 

р,S7=1

 

 

 

 

342

где Zj, . . . ,

ZN — выходные

сигналы согласованных

фильтров,

а величины

bpq определяются

формулой (12.5). Таким

образом,

при линейной зависимости входного сигнала от параметров вели­ чина Q (X) представляет собой функцию выходных сигналов согла­

сованных фильтров

Z 1...........ZN. Следовательно, и случайная ве­

личина V будет функцией выходных сигналов согласованных фильт­

ров:

 

 

 

 

V =

О(Q (X))

=

со (Zlt . . . , ZN).

(12.67)

Обозначив через

k x {гъ . .

. ,

zN) условную плотность

вероят­

ности выходных сигналов согласованных фильтров при наличии полезного сигнала, а через k 0 (zlt . . . , zN) — условную плотность вероятности выходных сигналов согласованных фильтров при от­ сутствии полезного сигнала во входном сигнале, получим следую­ щие формулы для вероятности пропуска сигнала и вероятности ложной тревоги:

 

рпр. с =

J ■• • J

k (гх, ■

zN) dz1 . . . dz„, j

 

 

(zi ...........*n ) < c

 

I

 

 

 

 

 

 

(12.68)

 

Рл.т=

1 ' ' ' 1

(^i> • •

■> Z/j) d.Zi . . . dzN.

 

 

(zi ............zn ) > c

 

 

 

Если входной сигнал X (t) представляет собой нормально рас­

пределенную

случайную

функцию, то

плотности вероятности k 0

и

легко

определить.

Однако вычисление вероятности ложной

тревоги и вероятности пропуска сигнала по этим формулам при произвольном N сложно. Практически формулами (12.68) легко пользоваться только при Л/ = 1 и JV = 2 и при нормальном рас­ пределении вектора U. В этом случае при N = 1 вероятность про­ пуска сигнала и вероятность ложной тревоги вычисляют по форму­ лам (12.68) элементарно. При N = 2 для вычисления интегралов в формулах (12.68) можно использовать сетки рассеивания, при­

меняемые в теории стрельбы.

В некоторых частных случаях при

N = 2 интегралы в формулах

(12.68) можно определить аналити­

чески.

Изложенный метод определения оптимальной системы обнару­ жения можно практически применить только в том случае, когда вероятность присутствия полезного сигнала во входном сигнале р известна. Однако в практических задачах она обычно не известна. Поэтому задачу обнаружения обычно решают по критерию услов­ ного минимума вероятности пропуска сигнала при заданной вероят­ ности ложной тревоги. Этот критерий обычно называют критерием

Неймана — Пирсона.

Обозначим а

заданную

вероятность ложной

тревоги. Тогда этот

критерий

можно записать

в виде

 

рпр. с =

min,

рл.т = а.

(12.69)

Применяя для нахождения условного минимума обычный метод неопределенных множителей Лагранжа, сведем задачу нахождения

343

оптимальной системы обнаружения по критерию (12.69) к нахожде­ нию безусловного минимума выражения

Р (Y = 0 | Ут = 1) -Ь цР (У = 1| Ут = 0),

где р, — неопределенный множитель Лагранжа. Эта задача равно­ сильна минимизации выражения

р р = о | у т= 1) + - ^ (VУ = 1 1П = 0).

Величина pp/q является неопределенной так же, как и у. Обозна­ чив ее X, приведем задачу к нахождению безусловного минимума выражения

рР (У = 0 I Ут = 1) + XqP (Y = 1| Ут= 0),

или

Р (Ут = 1 и У = 0) + ХР (Ут= 0 и Y = 1).

Это выражение, очевидно, представляет собой математическое ожидание функции потерь / (У, Ут), определяемой формулой

0

при

У =

Ут, '

 

 

I(У, Ут) = 1

при

У =

0,

Ут =

1,

(12.70)

X при

У =

1,

Ут =

0.

 

Таким образом, и задача определения оптимальной системы обна­ ружения по критерию Неймана—Пирсона сводится к минимизации условного риска М [/(У, УТ)]Х].

Подставив в формулу (12.43) выражение (12.56) плотности веро­ ятности вектора U и выражение (12.70) функции потерь и повто­ рив выкладки, проведенные в начале параграфа, находим условное математическое ожидание функции потерь при данном входном сигнале, которое, однако, в этом случае не равно вероятности ошибки системы:

М[1{

0, УТ)|Х]

_

PQ (X )

 

 

q + pQ (A T

 

 

 

 

(12.71)

 

 

__

qk

М[Ц 1. ^ 1^ = 7 + ^ , .

 

Отсюда совершенно так же, как и раньше, приходим к выводу, что алгоритм оптимальной системы обнаружения определяется фор­ мулой (12.63), где 0 (г) — произвольная возрастающая функция, а порог с = 0 (qXtp). Но определить порог по этой формуле практи­ чески невозможно, так как он выражается через неизвестную вели­ чину X. Однако в данном случае порог с можно непосредственно определить из условия равенства вероятности ложной тревоги задан­ ной величине а. Для этого достаточно положить во второй формуле (12.65) или (12.68) рл.т — а и решить полученное уравнение отно-

344

сительио с. Таким образом, алгоритм системы, оптимальной с точки зрения критерия Неймана—Пирсона, совершенно не зависит от вероятности р присутствия полезного сигнала во входном сигнале системы. В этом состоит большое преимущество критерия Неймана— Пирсона по сравнению с критерием минимума вероятности ошибки, обычно называемым критерием идеального наблюдателя Котель­ никова—Зигерта.

12.7. Определение оптимальных параметров системы, имеющей заданную структуру

При синтезе системы, линейной или нелинейной, из заданного набора типовых элементов обычно приходится рассматривать срав­ нительно небольшое число различных возможных вариантов систе­ мы, и в каждом варианте конструктор может распоряжаться срав­ нительно небольшим числом параметров. Как правило, такими пара­ метрами служат сопротивления, емкости и индуктивности в электри­ ческих цепях системы и коэффициенты усиления усилителей.

Если структура системы выбрана, то для определения оптимальных значений ее параметров необходимо найти зависимость приня­ того критерия качества от параметров системы. В простейших слу­ чаях эту зависимость можно найти в аналитической форме. При этом оптимальные значения параметров системы определяются системой уравнений, полученных приравниванием нулю частных производ­ ных критерия качества по неизвестным параметрам системы.

В сложных случаях, когда уравнения, полученные приравнива­ нием нулю производных критерия качества по параметрам сис­ темы, нельзя решить аналитически или когда не удается выразить критерий качества аналитически через параметры системы, для на­ хождения оптимальных значений параметров системы приходится прибегать к приближенным численным методам. Наиболее эффектив­ ным численным методом нахождения минимума функции является метод наискорейшего спуска и различные его разновидности. Задача нахождения максимума функции, очевидно, приводится к задаче нахождения минимума изменением знака функции.

Для выяснения идеи метода наискорейшего спуска рассмотрим сначала случай, когда требуется найти оптимальные значения двух

параметров

системы a lt а 2. Критерий качества является функцией

f (а1 , а 2),

минимум которой соответствует оптимальной системе.

Равноценным с точки зрения принятого критерия качества системам на плоскости параметров a lt a 2 соответствует кривая

f (alt

a 2) = с,

(12.72)

которая является линией

уровня

поверхности г = / (а2, а 2). Раз­

личным значениям параметра с соответствуют различные линии уровня (рис. 12.2).

Пусть (a"\ а£!) — точка, для которой вычислено значение функ­

ции /. Проведем из этой точки, как из центра, окружность бесконечно малого радиуса ds и найдем на этой окружности точку, в которой

345

функция / имеет минимальное значение. Предполагая, что существуют непрерывные ча­ стные производные функции / по а х и а 2, находим диф­ ференциал функции / в точке

(а'", а£‘):

 

df =

/«, dai + /«,

da2 =

 

=

(/„,

cos ф +

/;, sin ср) rfs,

 

 

 

 

 

(12.73)

 

где

аргументы

функций f ,

Рис. 12.2. Определение градиента функции в про­

f

для

краткости

опущены.

странстве параметров

 

 

 

 

 

Для нахождения минимума выражения (12.73) приравниваем нулю его производную по ср:

— /а, Sin ф + /а, cos ф = 0.

Отсюда находим

cos ср = ± kfai, sin ср = ± kf’a2,

1

k • (12.74)

2 + / '2 v i ах ~ 'а 2

где должны быть взяты либо оба верхних знака, либо оба нижних. Очевидно, что df будет положительным, если взять верхние знаки, и отрицательным, если взять нижние знаки. Таким образом, нижние знаки в формулах (12.74) соответствуют минимуму df и при смеще­ нии от точки (а"1, а£‘) на данную бесконечно малую величину ds

наилучшее приближение к минимуму функции / достигается, если

выбрать смещение в направлении вектора

с

соответствующими

f , f'a . Но вектор с составляющими /^,

/^

представляет собой

вектор градиента функции / на плоскости параметров а ъ а 2, нор­ мальный к линии уровня (12.72) функции / (рис. 12.2). Следователь­ но, для быстрейшего приближения к минимуму функции /, т. е. для скорейшего спуска по поверхности, изображающей функцию /, необходимо из каждой точки двигаться в направлении, противопо­ ложном направлению вектора градиента функции /. Иными словами, в каждой расчетной точке необходимо выбирать приращения пара­ метров системы пропорциональными соответствующим составля­ ющим вектора градиента функции / с отрицательным коэффициентом пропорциональности —km\

A a ? = — k j'ai (о™, а»), Да'" = — k J ’Ui (<*'", < ) .

В результате на плоскости а 1г а 2 получим ломаную, вершинами которой являются расчетные точки (см. рис. 12.2). Если увеличивать неограниченно число расчетных точек, неограниченно уменьшая

346

отрезки ломаной, то в пределе получим кривую, по которой будет течь по поверхности функции f вода, вылитая в какой-либо точке этой кривой.

Совершенно так же доказывается, что для скорейшего приближе­ ния к минимуму функции п параметров / (alt . . ., а„) необходимо для каждой расчетной комбинации значений параметров а"1, . . ., а "1

выбирать приращения параметров а ъ . . ап пропорциональными соответствующим частным производным функции / с отрицательным коэффициентом пропорциональности —/г„„ т. е. двигаться в п-мер- ном пространстве параметров а ъ . . . ,а„ в направлении, противо­ положном вектору градиента функции /. Для доказательства поло­ жим

 

dat =

h

ds\

 

 

 

(i

= 1 ,

. . .,

n)

 

(12.75)

 

£ ? + . . . +

S*

=

1 .

Тогда дифференциал функции f

 

 

 

 

 

d f = Y

fa dat =

Yi fa,li ds.

(12.76)

 

i=i

1

 

i=l

 

Так как £х, . . .,

связаны вторым уравнением (12.75),

то для

нахождения минимума df в данном случае удобнее всего воспользо­ ваться методом неопределенных множителей Лагранжа. Согласно этому методу для нахождения минимума df следует приравнять

нулю частные производные по

. . ., %п выражения

 

 

Yi fafii + ^ S

Ъ-

 

 

i= l

1

i= l

 

 

В результате

получим

 

 

 

 

 

fat

+

2КЬ =

0.

(12.77)

 

(t

=

1 , ■• ., п)

 

После решения

этих уравнений относительно

. . ., £„ вели­

чину К определяют из второго уравнения (12.75). В результате полу­ чим

Si =

-

 

(7

=

1 , . . . , п)

 

т =

V s f i ’

< i 2 j 8 )

что и требовалось доказать.

Таким образом, метод наискорейшего спуска дает следующую последовательность расчетных комбинаций значений параметров

347

.ац

начинающуюся в

произвольно

выбранной

исходной

точке (а®,

. . а°);

 

 

 

 

 

а Г И =

а »« — k j ' ai (а"\ . .

а"').

(12.79)

 

(«=

1 , ■•

«; tn = 0, 1 ,

2).

 

Вопрос о выборе длин шагов, т. е. чисел кт, решается в каждом конкретном случае опытным путем. При этом можно рекомендовать пользоваться следующими общими соображениями. При слишком малых числах /г,п приближение к минимуму будет медленным и объем вычислений будет большим. При слишком больших /г,п может случиться так, что функция / при переходе отт-й точки к + 1)-й возрастет (т. е. произойдет «перескок» через минимум). Поэтому числа km желательно выбирать возможно большими, но достаточно малыми для того, чтобы функция f убывала при переходе из каждой расчетной точки в следующую. Наиболее рациональным является такой выбор чисел /гш, при котором вектор градиента повора­ чивается приблизительно на 90° при переходе из каждой расчетной точки в следующую, т. е. при котором скалярное произведение век­ торов градиента функции / в соседних расчетных точках близко к нулю. В тех случаях, когда вычисление градиента функции f зна­ чительно сложнее, чем вычисление самой функции f. Н. М. Сотский рекомендует вычислять значения функции / для ряда значений km и выбирать каждый раз такое значение /е„„ при котором функция f имеет наименьшее значение. Очевидно, что при таком способе под­ бора значений kin вектор градиента функции f будет поворачиваться приблизительно на 90° при переходе от каждой расчетной точки к сле­ дующей. При этом число расчетных точек, в которых придется вы­ числять градиент функции /, будет близким к минимальному воз­ можному при данном выборе исходной точки (а®, . . .,а°).

Метод наискорейшего спуска и его различные разновидности позволяют находить минимумы сложных функций, зависящих от большого числа аргументов. Однако при очень большом числе аргу­ ментов минимизация функции требует большого объема вычислений. В этих случаях выгоднее пользоваться методом случайного поиска, который требует меньшего объема вычислений при минимизации функций очень большого числа аргументов [70]. Для облегчения и ускорения вычислений при отыскании минимумов функций целе­ сообразно пользоваться специальными вычислительными машинами— так называемыми оптимизаторами.

Г лава 13 СИНТЕЗ ОПТИМАЛЬНЫХ НЕЛИНЕЙНЫХ СИСТЕМ

13.1.Оценка параметра

Рассмотрим задачу оценки одного параметра, наблюдаемого с адди­ тивной помехой, которая представляет собой белый шум с интенсив­ ностью G,v и нулевым математическим ожиданием:

X (t) = U + N (t).

(13.1)

Случайная величина U имеет равномерное распределение на интервале [fr, с]. Определим алгоритм обработки наблюдаемого на интервале [О, Т] сигнала (13.1), оптимального по критерию мини­ мума вероятности превышения модуля ошибки заданной величины

 

P { \ U — U*\ >а} = m in .

(13.2)

Функция потерь для данного критерия

 

 

1 (U,

(0

при | U U* I ^ а,

(13.3)

U*) = | j

при

> а _

Условный риск

 

 

 

 

 

£/*— а

 

со

 

р (£/*) =

| /* | х) du +

J (гг| х) du.

(13.4)

 

— со

 

 

 

Минимум условного риска определим дифференцированием выра­ жения (13.4) по оценке и приравниванием производной к нулю:

- $ г = Р ( и * - а \ х ) - Г ( и * + а\х) = 0.

(13.5)

Отсюда

 

/* (U* — а | х) = /* {U* + a\x).

(13.6)

Вычислим апостериорную плотность вероятности. В соответствии с общей формулой (12.9) имеем

Г (и \х)

h (и ) f { x \ u )

(13.7)

 

J h (и) f (х | и) du

Знаменатель в выражении (13.7) не зависит от гг, поэтому равен­ ство (13.6) эквивалентно следующему соотношению:

h (U* — a)f(x\U* — a) = h(U* + a)f (х\ U* + а), (13.8)

349

где

 

 

 

 

 

f _ J _

при £>-j- a <

£/* <

c -|- a,

(13.9)

h (U* — a) = •!

c - b

при b + a >

U* >

c + a,

l

o

 

h (U* + a) =

 

при b a <

U* < c — a,

(13.10)

 

при b a >

U* > c a.

 

 

 

Таким образом, равенство (13.8) является нетривиальным при нахождении величины оценки в интервале b -\- а < U* < с — а В этом случае априорная плотность вероятности в левой и правой частях выражения (13.8) отлична от нуля, постоянна и равна 1/(сЬ). Сокращая на этот множитель, получаем

 

f { x \ U * - a ) = Hx\U* + a).

(13.11)

 

(b -f- а < U* < с а)

 

 

Вне этого интервала оценка равна нулю (U* = 0).

 

Условная

плотность

вероятности

 

 

 

f (х | и) = ехр | j

g (Т , т) X (т) dx---- 15(и)|,

(13.12)

где

 

 

 

 

 

 

 

g {Т, a) KN Ф, т) da

и;

(13.13)

 

 

 

Т

 

 

 

 

Р (и) = Uj g{T, т) dx.

 

(13.14)

 

 

 

о

 

 

 

Помеха в

рассматриваемой задаче

есть

белый шум,

поэтому

Kn (т>ст) —

(т — а),

и

соотношения

(13.13), (13.14) дают сле­

дующие выражения для весовой функции и функции р (и):

 

 

г< 7’' т>=

^

1<7' - т);

 

=

(13-|5)

Таким образом, условная плотность

вероятности

 

 

f(x\u) = e x p { - ^ H - - ^ } ,

(13.16)

где

т

Н= \ X (х) dx.

о

Подставляя в выражение (13.16) разность U* а и сумму U* +

+ а и учитывая, что равенство экспонент

соответствует равенству

показателей, получаем

 

 

( U* + a)2Т

U* — а

ту

(U* — a ) * T _ U *

+ a

Gn

П

2G,v

_

Gn

2G,v

Соседние файлы в папке книги из ГПНТБ