
книги из ГПНТБ / Методы оптимизации в статистических задачах управления
..pdf4) |
моменты приращения процесса выше второго порядка явля |
|||||||||
ются бескончено малыми более высокого порядка малости, чем Ы. |
||||||||||
Здесь |
оператор ~ |
является вектором-столбцом |
размерности п |
|||||||
с элементами |
і = |
I, |
2, |
. . |
п, |
где yt — одна из |
координат |
|||
вектора г/; оператор |
ö2 |
— матрица размерности |
[п, |
п] с эле- |
||||||
|
<Э2 |
|
1, |
2 |
. . |
п. |
|
|
|
|
ментами з—з—, г, / = |
|
|
|
|
||||||
|
дуі dyf |
1 |
|
|
|
|
|
|
|
|
Аналогичное |
содержание |
имеют |
операторы |
и ^ |
. |
|||||
В частности, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
а зр |
|
а 2р |
д2р |
|
|
|
|
|
|
|
дУх дух |
духду2 |
дУх дуп |
|
||
|
д2Р (t, X I т, у) |
|
д2р |
|
д2р |
д2р |
|
|
||
|
|
ду2 дУх |
ду2ду2 |
ду2 дуп |
|
|||||
|
|
дуду* |
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
д2р |
|
д2р |
д2р |
|
|
|
|
|
|
|
дУпдУх |
дупду2 |
дуп дуп |
|
При выполнении указанных условий диффузионный процесс удовлетворяет первому (обратному) и второму (прямому) уравне ниям А. Н. Колмогорова [23]:
dp (t, X Iт, у) |
__ |
^ |
,л |
ар fr, X I т, у) |
|
|
|
дт |
~ |
с |
У> |
ду |
|
|
1_ fr |
Ѳ(т, |
г/) |
д2р fr, |
X I -t, у) |
|
|
2 |
|
|
дуду* |
|
|
dp (t, |
x \ x t у) |
d ) [с |
*) р х \г’ |
+ |
||
|
dt |
|||||
+ |
X tr [ д Ш * [Ѳ |
$ р Ѵ’ х Iт’ ^)] |
(107) |
|||
|
Из второго уравнения А. Н. Колмогорова можно получить уравнение, определяющее одномерный дифференциальный закон распределения непрерывного марковского процесса. Для этого следует воспользоваться известным свойством плотности распре
деления вероятностей |
|
|
|
|
|
р (t, х) |
= |
| р |
(t, х\х, у) р (т, у) dy. |
|
|
Умножим обе части уравнения (107) на р (т, у) и проинтегри |
|||||
руем по переменной у. |
В результате получим следующее уравне |
||||
ние относительно р (t, |
х): |
|
|
|
|
d-Rr = |
~ |
d |
) ^ |
c (*• x) p V’ x)і + |
|
+ - T tr |
[ ш [Ѳ |
х) р Ѵ’ хЯ. • |
(108) |
||
|
37
Как правило, при исследовании системы управления (93) бывает известен закон распределения начального значения про цесса X (0) = х0 :
7? (0, х) = р о (х). |
(109) |
Тогда уравнение (108) должно решаться при начальном усло вии (109). Исходя из свойства плотности распределения, решение уравнения (108) должно быть нормировано:
j р (t, х) dx = 1.
Рассмотрим частный случай линейной системы, когда коэф фициенты сноса и диффузии определяются выражениями (104), (105). Уравнение А. Н. Колмогорова (108) в этом случае прини мает вид
|
=- ( £ У [(А |
|
rw) р & |
+ |
||
|
~ ~ , B ( t ) Q { t ) B * ( t ) p ( t , X) . |
|||||
Учитывая, |
что |
|
|
|
|
|
|
( ж ) * № № х + г W) Р (*> |
= |
|
|||
|
= 2 W t |
W х і + гі) Р V ' |
= |
|||
|
і, І |
|
|
|
|
|
= 2 |
( А , ! |
(t) Xj + |
r t) + |
2 Au (t) |
p (t , X) = |
|
І , j |
dp {t, x)~* |
|
|
І |
|
|
|
[■А (t) X + |
r] + |
[tr А (01 p (t, x), |
|||
|
dx |
|||||
|
|
|
|
|
|
получим
d-E % F ^ = - [ t r A { t ) ] p { t , X ) -
’dp (t, x)1* |
[А (t) x - \ - r (^)I -f- |
dx |
|
( 110)
B {t) Q {i)B * { t )
Характеристическая функция g (t, X), где X— я-мерный векторстолбец, связана с плотностью распределения соотношением
g (t, X) = М [е/х** (0] = I tik*x р (t, х) dx.
38
Для получения уравнения относительно характеристической функции следует левую и правую части уравнения (ПО) умножить на &'к*х и проинтегрировать по х. Тогда, применяя правило интегрирования по частям, получим
ö g jy , Я) __, у* а / а dg (t, X) |
+ ß*r(t)g(t, Я ) - |
|
|||||
т |
— к А \ч |
дх |
|
||||
|
- i x * ß ( / ) Q ( 0 ß * ( 0 W , X ) . |
(ill) |
|||||
Пусть начальное распределение р 0 (х) (109) нормально, так что |
|||||||
g |
(0, |
X) = |
exp |
ItYiok — |
Я DqK |
( 112) |
|
где |
|
т 0 = |
М [х (0)]; |
|
|
||
|
|
|
|
||||
D 0 |
= |
М [(х (0) — т 0) (х (0) — т 0) |
|
||||
Тогда решением уравнения (111) является |
|
||||||
g (t, |
Я) = exp |
j m |
(t) Я |
1 |
Я D (О Я |
(113) |
Таким образом, закон распределения случайного процесса л: (t) нормальный с математическим ожиданием т (t) = М [х(01 и дисперсионной матрицей D (і) = М [(х (t) — т (t) (х (t) — т (0)]. Для определения т (t) и D (t) выражение (113) подставим в фор мулу (111) и из условия тождественного выполнения уравнения получим:
т (t) = A (t) т (t) + г (/);
D (t) = А (t) D { f ) + D (t) А* (t) + |
(114) |
||
+ |
В (t) |
Q (t) В* (t). |
|
Согласно выражению |
(112) |
находятся начальные |
значения |
т (t) и D (t): |
т (0) |
= т 0; |
|
|
|
||
|
D (0) |
= D 0. |
|
Обыкновенные дифференциальные уравнения (114) опреде ляют поведение вектора математического ожидания и дисперсион ной матрицы фазовых координат системы в произвольный момент времени. Эти уравнения впервые получены Дунканом [126].
Для произвольной нелинейной системы (93) найти аналити ческое решение уравнения А. Н. Колмогорова (108) не удается. Однако можно использовать выражения (108) для вычисления некоторых частных характеристик случайного процесса, напри мер его математического ожидания и дисперсионной матрицы.
Для нахождения уравнений, которым удовлетворяют момент ные функции, удобно воспользоваться описанным выше методом
характеристической функции. Аналогично тому, как было полу чено уравнение (111) для характеристической функции линейного марковского процесса, можно получить уравнение относительно
g (t, Я) для марковского процесса с |
произвольными известными |
|
характеристиками с (t, |
х) и Ѳ (t, х) |
[27, 29]: |
dg д/ Х) |
= М [jX*c (t, х) exp (ß*x)] + |
+ 4 М КА*) Ѳ *) (А) ехР (А**)Ь
Используя известное свойство характеристической функции [82], состоящее в том, что
/у+ѵ1— ^гп |
|
д 1 |
й (Л Яі, Я2, • • •, Хп) |
дХ^дХ^- • -дХгп
а = х = . . . |
= а, = о |
= (/у 1+ ^ + - + ^ Л1[ ^ 2. •Хп
можно получить уравнение относительно любой моментной функ ции исследуемого процесса. Для этого в уравнении в частных производных относительно g {t, X) необходимо представить g (t, X) рядом Маклорена:
g (tл ) = 1 + |
|
х=о + |
||
I |
_ L I* d2g (t, X) |
^ |
+ o (IA f)- |
|
^ |
2 |
dXdX* |
|
|
= 1 + A*m + |
4 - (A*) (D + |
mm*) (jX) + о (| Ä,f ), |
||
где ИЯI — норма |
вектора Я. |
|
|
Приравнивая коэффициенты полиномов по переменной Я в ле вой и правой частях уравнения, получим обыкновенные дифферен циальные уравнения, которым удовлетворяют моментные функции. В частности, рассмотрение линейных членов дает уравнение отно сительно математического ожидания
т = М \с (t, х) ], |
(115) |
а квадратичных членов — уравнение относительно дисперсионной матрицы
Ь — М [хс* (і, х) + с (t, х) X * + Ѳ (t, *)], |
(116) |
О
где X — X — т является центрированным вектором фазовых коо р- динат.
40
Для линейной системы управления система уравнений для т (t), D (t) не содержит других моментных функций случайного процесса. При исследовании нелинейной системы правые части
уравнений (115), (116) не являются |
функциями только т (t) и |
D (t), поэтому из этой системы т (t) |
и D (t) не могут быть одно |
значно определены. Действительно, пусть исследуются статисти ческие характеристики процесса х (t) на выходе нелинейной си
стемы (93) при G (t, |
х) |
= |
В (t): |
X |
= |
f |
(t, х) + В (t) I (t). |
Непрерывный марковский процесс х (f) характеризуется зна чениями с (t, х) и Ѳ (t, х), определяемыми формулой (106). Исполь зуя выражение (106), запишем на основании формул (115), (116) систему уравнений для математического ожидания и дисперсион ной матрицы рассматриваемого процесса:
т (t) |
= |
М [/ (t, X |
(/))]; |
(117) |
|
D |
(і) = |
М lx (t) f* |
(t, X (0) + |
|
|
+ f ( t , x |
(0) X* |
(t)] + В (f) Q (t) В* (t). |
(118) |
В силу нелинейного характера зависимости f (t, х (t)) от фазо вых координат X (t) правые части уравнений (11'7) зависят не только от ш (/) и D (t), но и от старших моментных функций. Поэтому система уравнений (117), (118) должна быть дополнена уравнениями относительно моментных функций выше второго порядка. Эти уравнения могут быть получены из уравнения А. Н. Колмогорова с помощью того же приема [29], который был использован при выводе формул (115), (116). При решении прак тических задач необходимо в бесконечной системе уравнений отно сительно моментных функций ограничиться конечным числом, уравнений. При этом относительно старших моментов, для кото рых уравнения отбрасываются, делаются некоторые предположе ния, позволяющие замкнуть систему уравнений для моментов. Отметим, что при возрастании порядка моментные функции могут существенно возрастать и потому предположение о равенстве нулю моментных функций выше некоторого порядка является грубым. Практически следует связать старшие моментные функ ции с младшими в соответствии с некоторым законом распределения фазовых координат. Такой подход означает аппроксимацию истинного закона распределения фазовых координат некоторым заданным законом. Усечение бесконечной системы уравнений для моментных функций дает один из возможных способов такой аппроксимации.
Векторное уравнение (117) содержит п скалярных уравнений, матричное уравнение (118) содержит п2 скалярных уравнений,
из которых 1^ линейно независимы. Число уравнений,
41
определяющих старшие моментные функции, быстро нарастает. Так, для моментных функций третьего порядка следует решать
систему из -п ^ ^ п —— линейно независимыхуравнений.
В связи со столь быстрым нарастанием объема вычислений при увеличении точности результата в ряде случаев можно считать обоснованным ограничение рассмотрения уравнений для первых двух моментных функций (117) и (118). Как указывалось выше, для замыкания этой системы уравнений необходимо сделать
предположение о |
поведении старших моментных функций. |
Если есть основание |
считать одномерный закон распределения |
случайного процесса л: (t) близким к нормальному, то старшие моментные функции легко могут быть выражены через т (f) и D (t). Предположение о нормальности закона распределения поз
воляет |
рассчитать |
выражения |
[3, |
4] |
|
||
|
W1 l t , m ( t ) , D ( t ) ] = M [ f ( t , x m = |
|
|||||
|
J dxf (t, x) exp |
|
|
~2 ~(x — m(t))*D 1(t)(x— m(t)) |
|||
V{2n)n\D(t)\ |
|
|
|
|
|
(119) |
|
|
|
|
|
|
|
|
|
|
Y2 [/, m (t), D (01 = |
M [X (0 Г V, * (0)1 = |
|
||||
|
= — - |
1 |
- |
f dx(x — m (/)) /* (t, x) X |
|
||
|
V W |D (0 l |
J |
|
|
|
||
|
X exp |
-y- (x — m (/))* D 1 (t)(x — m (/)) |
, |
||||
де Чг2 |
связано c T j соотношением |
|
|||||
|
Y2 |
(/, m, D\ - |
n |
Г |
3YX(t, m, m i* |
( 120) |
|
|
Г |
011 |
Теперь использование формул (119), (120) в выражениях (117), (118) позволяет записать замкнутую систему уравнений относи тельно т (t), D (O'-
m — W1(0 т, D);
D = |
dW1 |
dm |
dm |
D) - |
( 121) |
|
(t , m, D) n |
- ачт (t, m, |
|
+ ß(0Q (0540 -
Система обыкновенных дифференциальных уравнений (121) должна решаться при начальных условиях
т (0) = /л0; ö (0 ) = D 0,
связанных с известным начальным распределением вероятностей фазовых координат.
Решение системы (121) дает приближенные значения матема тического ожидания и дисперсионной матрицы процесса х (О-
42
Точность результата зависит от возможности аппроксимации истинного закона распределения р (t, х) нормальным.
Выше указывалось, что одним из наиболее сложных вопросов в процедуре замыкания конечной системы уравнений для моментных функций является предположение о характере поведения старших моментных функций. Эта трудность практически не воз никает, если в качестве характеристик закона распределения выбрать не моментные функции, а семиинварианты [27]. Известно, что первые два семиинварианта совпадают с математическим ожи данием и дисперсионной матрицей процесса х (t). Семиинварианты более высокого порядка имеют тенденцию стремиться к нулю при увеличении порядка, а для нормального закона распределения семиинварианты, начиная с третьего, тождественно равны нулю. Поэтому для замыкания бесконечной системы уравнений относи тельно семиинвариантов естественно положить равными нулю семиинварианты выше k-ro порядка. Если k = 2, то система уравнений относительно первых двух семиинвариантов совпадает с системой (121). Увеличение точности, связанное с рассмотрением семиинвариантов выше второго порядка, как и при рассмотрении моментных функций, требует существенного увеличения объема вычислений.
5.Основы метода статистических испытаний
Впредыдущих параграфах были рассмотрены методы анализа стохастических систем автоматического управления, основанные на сведении исходной статистической задачи к задаче решения некоторой детерминированной системы уравнений. Эти методы обычно оказываются эффективными только для определенных
классов систем, где требуется или линейность системы, или огра ниченное число нелинейностей, или ограниченность порядка диф ференциальных уравнений системы. Подобные методы полезно применять на предварительном этапе проектирования, когда можно ограничиться относительно простой моделью системы. Наиболее общим методом анализа систем управления и по этому обычно наиболее дорогим в смысле использования машинного времени является метод статистического моделиро вания.
Метод Монте-Карло состоит в последовательном многократном решении уравнений, описывающих'~работу системы при различ ных реализациях случайных входных сигналов. Для каждого решения вычисляется значение критерия качества системы. Окон чательное среднее значение показателя качества работы системы обычно определяется как среднее арифметическое значений кри терия для всех проведенных решений.
При практической реализации метода статистических испыта ний на ЦВМ необходимо построить дискретную модель системы, которую было бы удобно реализовать на вычислительной
43
машине. Чаще всего эта модель строится в виде дискретных урав нений вида
X (іА + А) = / (х ((ІА), і) + I (ІД); |
(122) |
X (0) = х°
или в более общем случае
|
X (ІА + Д) = / |
(х (ІД), і, |
I (iA))\ |
||
|
|
X (0) |
= |
х°, |
|
где X = |
(xx, х2, . . |
х„) — вектор |
фазовых координат системы; |
||
х° — в |
общем случае |
случайный |
вектор |
начального состояния |
системы; | (ІД) — случайное возмущение на і-шаге.
Обычно исходная анализируемая система управления задается системой дифференциальных уравнений. В этом случае переход к дискретной модели осуществляется на основании использова ния численных методов решения систем дифференциальных урав нений. Теория точности численного интегрирования заданной системы дифференциальных уравнений довольно хорошо разра ботана [14, 68, 114].
Следующим этапом применения метода Монте-Карло является задача генерации случайных параметров х° и возмущений \ (ІА) (г = 1 ,2 ,3 , . . .) в полученной дискретной модели (122). Совмест ный закон распределения х° и £ (ІД) обычно нетрудно получить на основании анализа статистических характеристик случайных воздействий в исходной системе и метода построения дискретной модели. Существует два принципиально различных подхода к ге нерации случайных воздействий при статистическом моделиро вании на ЦВМ.
Первый подход основан на применении специальных устройствдатчиков случайных величину в которых используются случайные физические явления (радиоактивный распад, тепловые шумы в лампах и др.). Такие датчики дают последовательность истинно случайных чисел, которые не могут быть предсказаны или повторно воспроизведены.
Во втором подходе используются программные методы полу чения реализаций случайных чисел, с помощью которых происхо дит непосредственная генерация случайных чисел в ЦВМ. Строго говоря, эти числа не являются истинно случайными, так как всегда можно предсказать будущее случайное число и повторно воспроизвести всю последовательность. Поэтому такие последо вательности чисел называются квазиили псевдослучайными. Однако, как показывают теория и эксперимент, к результатам моделирования при использовании псевдослучайных чисел можно применять те же самые формулы оценок, что и при использовании истинно случайных чисел. Причем возможность повторного вос произведения псевдослучайной последовательности упрощает про цедуру отладки и проверки используемых алгоритмов.
44
Обычно моделирование случайных или псевдослучайных воз мущений разделяется на две подзадачи. Сначала вырабатывается последовательность независимых равномерно распределенных на отрезке [0, 1 ] чисел. Затем путем математических преобразований из последовательности равномерно распределенных чисел гене рируются случайные возмущения х° и £ (г'Д) с заданными стати стическими характеристиками.
Подробный анализ методов получения равномерно распреде ленных случайных чисел приведен в ряде работ [18, 24, 76]. Вопрос выбора математического преобразования для решения второй подзадачи приведен в работах [18, 76, 34].
После генерации случайных возмущений х° и £ (/А) произво дится решение системы дискретных уравнений (122). Предполо жим, что в результате анализа требуется определить математиче ское ожидание значения функции ср (х (тД)). Обозначим через фг значение функции ср для і-й реализации решения системы (122).
Тогда оценка искомого математического ожидания т после про ведения N реализаций будет определяться выражением
Дисперсия оценки математического ожидания имеет вид
В основе применения метода Монте-Карло лежит закон боль ших чисел. В форме Чебышева этот закон формулируется следую щим образом: пусть случайная величина имеет математическое ожидание т и дисперсию а 2. Тогда для оценки математического
ожидания т, полученной после проведения N испытаний, спра ведливо следующее неравенство:
(123)
где в — любое положительное число.
В случае, когда случайная величина имеет конечный централь ный момент третьего порядка ß3, неравенство (123) может быть заменено [38 3 более жестким условием вида:
СО
Р (т — т > е)
eVN
О
(124)
45
где константа с0 удовлетворяет условию
0,3989 ^ с0 < 0,9051.
Применение неравенства (124) требует знания второго и третьего центральных моментов случайной величины ф, что практически создает неудобства. При достаточно большом зна чении числа испытаний N на основании центральной предельной
теоремы можно считать, что оценка т имеет нормальный закон распределения. В качестве значения дисперсии сг2 в этом случае
можно принять оценку дисперсии D вида
Тогда вероятность того, что погрешность метода превышает величину е, определяется выражением
СО
Р(\т —т I > е) = |
j e 2 du. |
(125) |
V 2л |
Еyn |
|
Vs
Формула (125) чаще всего используется для оценки точности вычислений по методу Монте-Карло. Задаваясь допустимой по грешностью вычислений е* и допустимой вероятностью превыше ния этой погрешности р*, по формуле (125) можно рассчитать необходимое число статистических испытаний N. В частности, подставляя заданные значения р* и е* в уравнение (125), получим уравнение относительно параметра N:
СО
р* = —Д=- |
I е 2 du. |
(126) |
V 2л |
е» yn |
|
Vd
Из соотношений (123), (124) или (126) следует, что при фикси рованной вероятности р превышения допуска е величина допуска прямо пропорциональна среднему квадратическому отклонению случайной величины ф и обратно пропорциональна квадратному
корню из числа проведенных испытаний ]ЛУ: |
(127) |
|
8 |
k( p) - £ = |
|
|
V n |
|
Заметим, что в соотношении (127) коэффициент пропорциональ ности k зависит только от вероятности р превышения погрешности уровня 8 и не зависит конкретно от существа решаемой задачи анализа. Это общее соотношение справедливо для любой реали зации метода Монте-Карло.
46