Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Системы экстремального управления

..pdf
Скачиваний:
10
Добавлен:
19.11.2023
Размер:
33.28 Mб
Скачать

решение. Это решение принимается на базе информации, получаемой с объекта управления. Если эта информация мала, то и управление будет приближенным. Если же объем полученной информации достаточно велик и в пол­ ной мере описывает состояние объекта, то управление будет точным. Таким образом, всякому акту управления предшествует идентификация объекта, в процессе которой получается информация, необходимая для построения управления. Объем этой информации может быть разным: от минимального до максимального. В первом случае процесс поиска будет многошаговым с последовательным уточнением на каждом шагу, а во втором — может быть одношаговым, когда при идентификации получено полное описание объекта, необходимое для реализации целей управления.

Как легко заметить, первый случай в экстремальном управлении соответствует простейшему поиску, а вто­ рой — определению функции качества объекта Q (X) (точнее, определению тех сведений об объекте, по которым можно выяснить положение экстремума X*). Рассмотрим

последний

случай.

 

 

 

 

 

Задача ставится следующим образом: построить такую

стратегию

наблюдений

показателя

качества Q (X), т. е.

определить точки Х1?.

X N ,

д л я

которых при задан­

ном N и имеющихся априорных сведениях можно полу­

чить

модельное описание

QM(X), минимальным образом

отличающееся от

действительного

Q (X), например, в

смысле

минимума

функционала

 

 

 

 

 

J = | [Q(X) — Q* (X)]2 dX,

(11.5.1)

где

S — область

определения

X,

т. е. X e S

 

Возможны и другие формы минимизируемого функ­

ционала:

J =

max (| Q(X) -

<?„ (X) |}

(11.5.2)

 

 

 

и т. д.

 

 

xes

 

 

 

 

 

 

 

 

 

 

 

 

 

Прежде всего, рассмотрим вопрос об априорных све­

дениях,

необходимых

для

построения модели

QM(X).

Эти сведения должны нести информацию о том, в классе каких функций искать модель ÇM(X). Это означает, что необходимо иметь аналитическое описание модели

с точностью до конечного ряда параметров

А = (вц . . ат),

(11.5.3)

которые должны быть определены в процессе идентифи­ кации объекта и определения модели:

<?м (X ) = F (ХМ),

(11.5.4)

где F — известная функция, заданная на основе апри­ орных сведений об объекте.

Наиболее простой формой модели может служить квадратичная форма

F (ХМ) = а + [X, А'Х] + U", X],

(11.5.5)

где а — постоянный член, А' — матрица коэффициентов п X п, А" — «-мерный вектор, а квадратными скобками

обозначено

скалярное произведение. Эта форма имеет

т = Y (п + 1 ) (и +

2) неизвестных коэффициентов: один

свободный

член, у

«(«'+ 1 ) разных элементов матрицы

А' (ац = a,ji) и п компонент вектора А".

Как видно, описание модели в виде квадратичной формы требует при большей размерности задачи определения большего числа неизвестных постоянных. Это наиболее существенный недостаток квадратичной модели.

по

Можно описание объекта искать в форме разложения

известным функциям срх (X), <p2 (X),

«pm (X):

 

т

 

 

 

<?м(ХМ)=2

я|ф1 (Х) = [Л,Ф(Х)],

(11.5.6)

 

i=l

 

 

где

Ф = (фх, ф2, . .,

фт), [,] — знак скалярного про­

изведения. В этом случае существенным является выбор класса функций (фг (X)}. Эти функции для хорошей ап­ проксимации объекта должны отражать специфику объек­ та. Так, для квадратичного объекта система функций Ф (X) должна быть набором определенных квадратичных форм, линейная комбинация которых описывает объект.

Так или иначе, но предполагается, что функция QK (ХМ) известна с точностью до параметров А, которые должны быть определены в процессе идентификации объекта.

Этой мерой задача идентификации параметризуется, т. е. сводится к определению конечного числа парамет­ ров ах, a2i ., ат. Таким образом, априорные сведения об объекте необходимы только для определения вида функции Q№(Х/А). Как только вид этой функции опре­ делен, можно переходить к процедуре идентификации.

Задачу идентификации

можно подразделить на

две.

В первой — необходимо

идентифицировать объект

но

результатам замеров функции качества в заданных со­ стояниях. А во второй — определяются состояния, в ко­ торых необходимо произвести замеры, чтобы при задан­ ном N модель имела наибольшую точность, т. е. заданный

функционал

был бы

минимален.

 

Начнем с первой

задачи.

 

А. Идентификация по замерам в заданных состоя­

ниях. Пусть заданы несовпадающие

состояния Хх,

. . . , X N и значения функции качества в этих состояниях

Qi Q (Хх),

., QN = Q ( X N). Для

определения неиз­

вестных параметров воспользуемся методом наименьших квадратов. Для этого составим функцию невязки объекта и его модели в наблюдаемых точках:

N

9 ( A ) = '2 l Q i - Q m A ) ] \

(И .5.7)

1= 1

 

где N > т. Очевидно, что для определения А достаточно минимизировать эту невязку по параметрам А , т. е. ре­ шить систему из т уравнений:

дд (А)

да. = 0 (i = 1 , .. . ,т)

или в развернутой форме

ДdQ tX JA )

2

a,' [<?i - Q №/•!)] = 0 (>=1........

т). (11.5.8)

7 = 1

г

 

Для решения этой задачи можно воспользоваться, на­ пример, методом Ньютона, рассмотренным ниже, в § 13.4. Если вычисление частных производных dQ/dai представляет трудности или невозможно, то следует вос­ пользоваться прямой поисковой минимизацией функции

невязки q (Л), т. е. решить задачу оптимизации

 

q(A) —>min.

(11.5.9)

 

 

А

 

Полученные в результате таких манипуляций значе­

ния параметров av

.,

ат и следует считать решением

задачи идентификации по данным измерениям.

 

При реализации этого метода следует помнить, что

успех идентификации

в

значительной степени

зависит

от выбора состояний Х г,

., X N , где собирается инфор­

мация об объекте. На этот выбор накладываются опреде­ ленные требования.

Теперь рассмотрим более общую задачу определения состояний, в которых должна быть получена информация, чтобы идентификация была оптимальной.

Б. Оптимальная идентификация. Задача оптимальной идентификации возникает при наличии случайных помех, накладывающихся па показатель качества объекта. При этом параметры модели объекта определяются с естест­

венной ошибкой.

Пусть е15 .

., ет — ошибки параметров

модели А = (ах,

ат ):

 

 

 

% = а\ + Ец

 

 

а2 =

а®"Ь е2>

(11.5.10)

 

_

о

,

 

 

 

Я т

 

-J- Sm,

 

где А0 = (al,

., а™) — точные значения параметров

модели, которые могут быть определены лишь при беско­ нечном объеме наблюдений, т. е. при N -+■эо. Однако в реальных условиях N конечно и, как правило, невелико.

Ошибки Si,

em имеют ненулевые дисперсии

о\ =

D (aj = D (Б1) = о\ >

0,

 

D (ат) — D (em)j= Ощ

(11.5.11)

oVn =

0.

Очевидно, чем меньше эти дисперсии, тем точнее опреде­ ляется модель объекта. Будем точность модели оценивать суммой

т

/ = 3 <4. k=i

Естественно, чем меньше эта сумма, тем точнее модель.

Инаоборот.

Величина J, как нетрудно заметить, зависит от рас­

положения пробных состояний

Xi (i = 1,

N), т. е.

J = J 15 Х2,

X N).

(11.5.13)

Задача оптимальной идентификации сводится к выбору такого ряда состояний Х15 ., X N ( и л и , как говорят, плана), при котором показатель J принимал бы мини­ мальное значение, т. е. к решению следующей экстре­ мальной задачи:

J (X lt . . . , X N)-*

min

,

(11.5.14)

 

X t e S (i= l.....N)

 

 

где S — область, в которой допустимо выбирать состоя­ ния Xi. Таким образом, задача оптимальной идентифика­ ции сводится к минимизации функционала J.

План, удовлетворяющий условию (11.5.14), называют ^-оптимальным (где D обозначает дисперсию; правильнее его было бы назвать .D-минимальным, так как дисперсия минимизируется) [11.3].

Для синтеза плана, прежде всего, нужно уметь опре­ делять функционал (11.5.13). Сначала исследуем зависи­ мость идентифицируемых параметров от плана Х г,

., XN - Пусть функция качества представляется в виде разложения (11.5.6) по заданной системе функций

 

Ф(Х) =

[срх(X),

ф2(Х),

.,фп(Х)].

(11.5.15)

Тогда система уравнений (11.5.8) принимает вид

«Г

 

т

 

 

 

S [ft-

S ад* да]и д а

- о <г =

i , . . . , т).

j=i

fc=i

 

 

(11.5.16)

 

 

 

 

 

Эту систему можно записать в виде

 

 

т

 

 

 

 

3

л*Фк =

(Î =

1, . . . , т),

 

к=1

где коэффициенты <pki и ф* зависят от Ху.

N

= 2

Ф* (Xi) <Pi №)>

(Il .5.18)

7=1

 

 

N

 

 

% = 2

QiФ»да.

(И.5.19)

7=1

Как видно, (11.5.17) является системой линейных алге­ браических уравнений, решение которой методом Кра­ мера [11.2] имеет вид

Й* = Т¥Т =

(11.5.20)

где матрица М называется информационной матрицей

Фишера [11.4]:

(11.5.21)

М = |ф £/||;

| М |— ее определитель, Мк — матрица,полученная из матрицы Фишера (11.5.21) путем замены ее к-то столбца на столбец из правых частей системы (11.5.17), т. е. стол­

бец

ф£ (i — 1,

., тп).

 

 

Теперь можно определить дисперсию искомых коэф­

фициентов в функции

Хх,

Xjv'.

 

 

 

 

 

m

 

 

4

= D(ak) = 1ÿ T '2 \ M i \ \

(11.5.22)

где

a2 — дисперсия измерений показателя

качества:

 

 

 

а2 =

£>(<?),

(11.5.23)

М\

—минор матрицы

М,

полученный вычеркиванием

i-й

строки и к-то столбца.

 

 

 

И, наконец, можно выписать выражение для точности

модели (11.5.12)

m

m

 

 

 

 

 

 

 

^ = T F F 2 2 1^*1*.

(11.5.24)

11 i=i fc=x

изадача (11.5.14) сводится к минимизации функционала

m

 

 

 

 

2 uni*

—>

min

,

(11.5.25)

)C,i=l

I MIs

x , e S ( i = i , . . . , N )

 

 

где в числителе стоит сумма квадратов определителей всех

миноров

матрицы

Фишера.

 

 

Можно показать, что эту задачу можно упростить и

свести к

простому

виду:

 

 

 

|М |—> max

,

(11.5.26)

 

 

**<=8(1=1......N)

 

 

т. е. свести к максимизации определителя матрицы Фи­ шера.

П р и м е р . Пусть имеем одномерный и линейный объект

Q (X, А) = ах + а2х.

Надо построить £>-оптимальный план из N экспериментов Х1У ., X JV в зоне S : 0 ^ х ^ 1. Матрица Фишера в этом случае принимает вид

 

 

М =

 

1

Я

где

 

 

Я ж5

 

 

 

 

 

 

= 4 r2 * i> я2 = - ^ 2 * *

 

i= l

 

 

N

 

 

 

1=1

Задача (11.5.26) сводится

 

к

виду

N

N

2

 

 

 

2

— -J r ( S x i)

m a x

(i = 1 , . . . , N ).

i =1

i = i

sc*S[0,l]

Так, для

N = 2 получаем

 

 

(xï

x%)------ (^ i +

X2)2 =

- i

- (x-i -J- X2)2—> min .

Решение очевидно: хг = 0; x2 — i или xx = 1; x2 — 0. Таким образом, задача идентификации вообще, а оптимальной идентификации в частности связана, прелю­ де всего, с процессом многопараметрической оптимиза­ ции, т. е. с решением задач (11.5.9) или (11.5.26). Оче­ видно, что идти на идентификацию следует только тогда, когда объект не допускает поиска и поэтому следует ми­

нимизировать число экспериментов с объектом.

МАТЕМАТИЧЕСКИЕ АСПЕКТЫ ЗАДАЧИ

МНОГОПАРАМЕТРИЧЕСКОЙ ОПТИМИЗАЦИИ

§ 12.1. Задачи оптимизации в открытой области (необходимые и достаточные условия экстремума)

Рассмотрим сначала математические методы решения задачи многопараметрической оптимизации при отсут­ ствии ограничений (ограничения могут быть, но заранее предполагается, что точка экстремума удовлетворяет всем ограничениям).

Задача сводится, таким образом, к отысканию поло­

жения экстремума X* =

(х1} х2,

хп)

непрерывной

скалярной функции:

 

 

 

Q = Q (X) =

Q {хх,

., хп).

(12.1.1)

Переменные хг, ., хп при этом считаются независимыми, так как ограничений нет или, точнее, они не играют роли.

Рассмотрим сначала необходимые условия существо­ вания экстремума. Введем понятие стационарной точки [12.1]. Стационарной точкой принято называть такую точку пространства параметров, где все частные произ­ водные равны нулю. Стационарная точка может опреде­ лять положение экстремума п «седла», которое является аналогом точки перегиба в одномерной задаче.

Необходимым условием экстремума непрерывной функ­ ции является либо стационарность этой точки, либо отсут­ ствие частных производных в ней. Таким образом, для отыскания экстремума следует, прежде всего, найти ста­ ционарные точки, координаты которых определяются из следующей системы уравнений:

(12.1.2)

и точки отсутствия хотя бы одной частной производной. Однако эти точки не обязательно будут экстремумами.

Но экстремум, если он имеется, обязательно находится среди этих точек.

Для того чтобы решить, являются ли полученные ста­ ционарные точки и точки разрыва частных производных экстремумами, необходимо проверить достаточные усло­ вия экстремума [12.2].

Достаточные условия экстремума отвечают на вопрос: является выбранная точка экстремумом или нет? Самый надежный и строгий метод такого рода проверки заклю­ чается в непосредственном сравнении «подозреваемых» на экстремум точек с близлежащими точками.

Достаточное условие экстремума (минимума) в точке

X* выражается в виде неравенства

 

Q (X*) < Q (X* + А)

(12.1.3)

для всех возможных значений вектора А, модуль которого достаточно мал, но не равен нулю. Если какая-либо из стационарных точек или точек разрыва не удовлетворяет этому условию, то эта точка не является минимумом. Аналогично строится условие достаточности для макси­ мума.

Однако проверка условия достаточности в виде (12.1.3) приводит к непрактичным затратам. Строго говоря, про­ верка условия во в с е х точках, хотя и достаточно близ­ ких, связана с бесконечным числом вычислений, что нельзя считать приемлемым. Именно поэтому условие (12.1.3) следует заменить другим, более простым, если наложить на функцию качества Q (X) некоторые ограничения.

Такое условие можно сформулировать для стационар­ ных точек. Начнем со случая п = 2.

Разложим функцию качества Q {х1Ух2) в ряд Тейлора

в районе стационарной точки fo, х2) и ограничимся членами второго порядка малости (возможность такой операции и есть ограничение, накладываемое на функцию качества):

Q (*1. г ,) »

Q ( il, 4 )

+

Ц

- (Z i —

4 )

+

(*« —

4 ) +

+ ~ т [ Щ

t o “

+

2 s

i r t o

-

*î> t o

- 4 )

+

+ Ц ( ъ - 4 г \ - №-iA)

Так как точка {х\, xl) предполагается стационарной, то оба слагаемых первого порядка равны нулю. Обозначим

а.1 = х1- х \ ,

 

(12.1.5)

ОС2 — 3^2

 

 

 

Тогда

d*Q

„ „ _ I

d*Q „ г

Q(ai, a2) =^ + ^ a ; + 2

дахдаъ

aia2 +

- ^ -a 2. (12.1.6)

Это — уравнение кривой второго порядка. Из теории этих кривых известно, что точка <хг = а2 = 0 является ло­ кальным экстремумом (а не седлом и т. д.), если

d*Q

d*Q

d2Q

 

(12.1.7)

даI

да\

дахдаг ^

 

минимумом, если

 

 

 

 

дЩ ^ л

d2Q ^

п

(12.1.8)

да\

^

dal

 

 

 

имаксимумом в противном случае.

Вобщем случае многих переменных достаточные ус­

ловия минимума

принимают

вид

 

Z>i> 0 (1 = 1,2,

., п),

(12.1.9)

где Di — определитель вида

 

 

 

 

02Q

д2Q

 

d*Q

 

 

dxidx2 ' ' *dxidx^

 

 

d2Q

d2Q

 

d2Q

 

A =

дхгдхх

2 * * " дхчдх.

(12.1.10)

 

d2Q

d2Q

 

d2Q

 

 

dxfixi dxâx%

' ' * Qx%

 

В случае максимума

условия достаточности выглядят

несколько иначе:

 

 

 

 

 

 

Di > 0

(i

= 2,

4,

6,

.),

(12.1.11)

Di <

0

(i =

1,

3, 5,

. ; .).