Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Системы экстремального управления

..pdf
Скачиваний:
10
Добавлен:
19.11.2023
Размер:
33.28 Mб
Скачать

Он

равен

 

 

 

 

(11.3.13)

 

ÀÇmax =

8 1/"а \ +

„2

 

 

Ой

 

 

и соответствует направлению

 

 

 

е =

(cos ф*, sin ф*) = / — j. ai —=~ • — г Д2

\

(11.3.14)

где

\ V at + <

V < + < ) '

 

*

 

, Д2

 

 

 

 

=

 

 

(11.3.15)

 

Ф

arctg — .

 

Пусть вектор градиента по первому определению равен grad'Ç (X) = (6 Х, Ьа). (11.3.16)

Тогда его модуль по определению равен

|grad'<?(X)| = / ï f + ^ = - ^ i = Vr“f+ ^ . (Н.3.17)

а направлен он вдоль вектора е (11.3.14), т. е.

grad' Q (X) =

а\ + ai е.

(11.3.18)

Таким образом, получаем для его компонент

 

Ьх =

|/~ ах + а\ cos ф* =

ах,

(11.3.19)

Ьг —

af -j- al s i n Ф* =

aii

 

T . G .

 

grad Q (X)

(11.3.20)

grad'Ç (X) =

и оба определения градиента идентичны. (Аналогичные рассуждения позволяют распространить это утверждение

на общий случай п >= 2

.)

 

Определим соотношение между линией равного уровня

и градиентом.

 

 

Уравнение прямой, касательной к линии равного

уровня в точке Х 0, имеет вид

 

ах (хх — xl) +

а2 {х2 — а£) + <?о = с.

(11.3.21)

Наклон этой прямой к оси хх равен

 

Ъ

- ~ “ .

(11-3.22)

Наклон вектора градиента к оси хх равен

(11.3.15)

*, = tg<f = V -

(11.3.23)

А так как

(11.3.24)

кх-к2 = —1,

то градиент ортогонален к касательной линии равного уровня.

На рис. 11.3.6 показаны примеры линий равного уровня с нанесенными градиентами. Как видно, векторы

Рис. 11.3.6. Соотношение меж-

Рис. 11.3.7. Пример градиепт-

ду линиями равного уровня и

пых линий,

градиентом.

 

ортогональны к линиям равного уровня и по модулю обратно пропорциональны расстоянию между этими ли­ ниями.

Еслидвигаться вдоль градиентного направления, отсле­ живая его в каждой точке траектории, то получается линия, называемая градиентной. На рис. 11.3.7 пока­ заны примеры антиградиентных линий, двигаясь вдоль которых можно быстро попасть в минимум.

§11.4. Модели многопараметрических объектов

Рассмотрим несколько наиболее типичных моделей многопараметрических объектов. В качестве таких моде­

лей можно предложить функции определенного вида. Отличительным свойством этих функций является то, что они отражают различные особенности связи между вхо­ дом и выходом реальных экстремальных объектов. Про­ стейшей является линейная функция.

 

А. Линейная модель.

Она

имеет вид

 

 

<?(X) =

Ç0 + U ,

X I

(11.4.1)

где

Qo = Q (0); А =

(а1}

а2,

•>

я»») — вектор

парамет­

ров

модели. Здесь

квадратными

скобками обозначено

Рис. 11.4.1. Линин равного уровня линейного объекта.

скалярное произведение. В скалярной форме линейная функция записывается так:

Q (X) — Qo + агхх + а2х2 +

+ апхп. (11.4.2)

Как видно, вектор А этой функции совпадает с ее гра­ диентом

grad Q = А.

(11.4.3)

Следовательно, при А = const градиент линейной модели не зависит от положения системы X. На рис. 11.4.1 по­ казан характер поведения поверхностей равного уровня Q (X) = const, которые для линейной формы являются гиперплоскостями.

Линейная модель хорошо описывает гладкие объекты в малой окрестности. Действительно, разложим функцию качества объекта Q (X) в ряд Тейлора в окрестности точки Х0 и ограничимся линейными членами разложения:

<? (X) = Ç (Х„) + -Ц -1_ _ (*,

-Со)-

х \

) + • • •

х=х.

3Q

 

 

(хп — л40)). (1 1 .4.4)

 

дх„

 

Х=х„

Как видно из этого выражения, при Х 0 = 0 оно совпадает с (11.4.1). Это означает то, что линейное представление (11.4.1) возможно для любой достаточно гладкой функции качества в малой окрестности исходной точки (гладкость здесь необходима для того, чтобы можно было ограни­ читься линейным приближением).

Линейная модель применяется обычно при исследо­

вании

поведения локальных алгоритмов поиска вдали

от экстремума, где

поверх­

 

ности равного уровня имеют

 

уплощенный характер.

 

Б. Центральная

модель.

 

Для

моделирования поведе­

 

ния объекта в районе экстре­

 

мума

X* часто применяется

 

центральная модель, которая

 

представляется в виде

 

Q(X)

=

Q* + f ( \ X - X * I),

 

где Q* -

 

(11.4.5)

рис> ц 4 2. Линии равного

экстремальное зна-

УР°ВНЯ Центрального объекта,

чение

Q * — Q (X*);

/(•) —

 

неубывающая функция, равная нулю в экстремуме: /( 0 ) =

=

0. На рис. 11.4.2 показаны поверхности равного уров­

ня

этой модели — это концентрические

окружности.

 

Наиболее

распространены

следующие

конкретизации

центральной

модели:

 

 

 

 

 

 

 

 

Q СЮ =

<?* +

/с | X —

X * |,

 

(11.4.6)

 

 

Q (X) =

Q* +

к (X -

X* ) 2

 

 

 

 

 

или в скалярной форме

п

 

 

 

 

 

 

 

 

 

 

 

(11.4.7)

 

 

< ? № = « • + *

(2

t o - * ) * ) * .

 

 

 

 

П

 

 

 

 

 

е(Х) = < ? * + * 2 &

 

 

(11.4.8)

 

 

 

 

Î=I

 

 

 

Выражение

для центральной

модели удобно

записать

в следующей форме:

 

 

 

 

 

 

 

 

Q (X) =

<?*

+ /

(г),

 

(11.4.9)

где г = | X — X* | — расстояние до цели в пространстве оптимизируемых параметров {X}. Как видно, значение показателя качества этой функции зависит только от расстояния до цели г.

Рис. 11.4.3. Модели

центральных функций качества:

а) конус,

 

 

 

6)

параболоид вращения.

 

 

 

Градиент центральной модели

равен

 

 

 

 

 

grad Q (X) =

Г (1 * -**!> (X -

X*)

(11.4.10)

и

для

рассмотренных

частных

случаев

получаем при

/

(г) =

кг

 

 

 

 

 

 

 

grad Ç(X) = -£-(X — X*) = к dir (X -

X*),

(11.4.11)

при

/(г) = кг2

 

 

 

 

 

 

 

 

grad Q (X) = 2к{Х — X*),

(11.4.12)

где

dir

знак направления:

 

 

 

t o Z = T f p

Как видно, первая модель (11.4.11) имеет постоянный модуль градиента (это конус, двумерный случай кото­ рого приведен на рис. 11.4.3, a), a градиент второй модели (11.4.12) увеличивается по мере удаления от экстремума

(это —

равноосный

параболоид, двумерный случай

ко­

торого

показан на

рис. 11.4.3, б).

оо,

При значительном удалении от цели, т. е. при г

центральная модель

вырождается в линейную. Действи­

Рис. 11.4.4. Линии равного уров­ ня эллиптической модели.

тельно, разлагая центральную функцию (11.4.5) в ряд Тейлора, в районе точки X получаем

Q (X) =<?• + / (г) + Х Ы - ( Х - Х * )

(11.4.13)

и при г оо имеем квазилинейную функцию

 

Q (X ) = Q0 + /' (г) dir (X — X*).

(11.4.14)

Рассмотренная центральная модель, по сути дела, имеет однопараметрический характер, так как ее поведение целиком и полностью опре­ деляется расстоянием до цели г. Для моделирова­ ния это очень удобное свой­ ство. Однако такая функ­ ция не всегда точно отра­ жает ситуацию в районе цели.

При центральной функ­ ции качества все коорди­ наты равноправны, что

редко выполняется на практике. В действительности раз­ личные параметры объекта по-разному влияют на пове­ дение показателя качества в районе цели. Именно это об­

стоятельство заставляет обобщать центральную

модель.

Одним из таких обобщений является

 

В. Эллиптическая модель. Она имеет вид

 

П

 

 

Ç ( X ) = Ç 4 - / [ 2

b . f o - a ÿ l .

(11.4.15)

4=i

J

 

где /(•) — по-прежнему неубывающая функция, a Q* — экстремальное значение показателя качества.

Как видно, поверхности равного уровня этой модели являются эллипсоидами вида

П

 

2 h { x i — я* ) 2 = const

(11.4.16)

1=1

 

с центром в точке X* = (а£,

^ ) и с

осями, пропор­

циональными значениям

(i = 1,

.,

тг) (рис. 11.4.4).

Эта модель уже более точно моделирует поведение объекта

в районе цели. Наиболее распространенная форма эллип­

тической модели получается при / (у) =

у и X 0

N

 

Q (х) = 2 hx\.

(11.4.17)

t=i

 

Однако и эта модель не отражает всех особенностей пове­

 

 

дения

объекта

в

районе

 

 

цели.

Более

общий

вид

 

 

имеет

так называемая

 

 

Г.

Сепарабельная

мо­

 

 

дель. Она отличается вза­

 

 

имной разделимостью дей­

 

 

ствия

каждого

из

пара­

 

 

метров:

П

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

<? (X) =

2

A te -

*0.

 

 

 

 

 

 

 

(11.4.18)

 

 

где fi (•)

(i =

1,

 

 

п) —

функции с минимумом в начале координат.

 

 

 

Пример

сепарабельной

модели

вида

 

 

 

 

 

Q (X) =

| хг | +

4

 

 

 

(11.4.19)

показан на

рис. 11.4.5.

 

 

вид модели,

когда

Теперь

рассмотрим более общий

имеется перекрестное влияние параметров. Наиболее про­ стой моделью этого типа является

Д. Квадратичная модель. Она записывается в виде

Q (X ) = Q* + 1А,Х] + [X, (ВХ)]. (11.4.20)

Здесь А = (а1( . ., ап), квадратными скобками обозна­ чено скалярное произведение, В — квадратная матрица вида

Ьц &12 •. • Ь1п о &21 Ьц ... Ь2п

Y = (ВХ) — линейное преобразование вектора X в век­ тор Y = (ylt ., гуп). Это преобразование имеет вид

Ух

^11*^1"Ь ^12^2 ”Ь

“b ^1П^-Ч

 

У 2

~

^21*^1 Ч " ^22^2

"1"

“I" Ь % п Х п

(11.4.22)

 

 

 

 

 

У п

=

^711*1Ч" Ь п ^ Х 2

4 “

• * Ч~ Ьп п Х п .

 

Функцию q =

[X,

(ВХ)1 называют квадратичной формой.

Ее удобно записать в виде

 

 

 

 

 

П П

 

 

Q(^îi • • • I яп) = 2

2

bijXjXi.

(11.4.23)

 

 

;=l i=l

 

Заметим, что число независимых параметров квадратич­ ной формы не п2, как может показаться с первого взгляда,

а тр п (п

+ 1). Действительно, если привести

подобные

члены в

(11.4.23), получим члены вида

 

 

(Ьц + bл) XfXj,

(11.4.24)

т. с. квадратичная форма однозначно определяется мень­ шим числом параметров, чем п2.

Указанное позволяет ограничиться только теми пара­ метрами формы b{j, для которых имеет место неравенство i < /, т. е. считать, что

btj 0 для i > ;.

(11.4.25)

Матрица В (11.4.21) в этом случае принимает треугольный вид:

Ъхх &12 &13 • •

b l n

0

^22 &23 • •

&2п

0

0

СО

• •

ьзп

 

 

со

0

0

0

. • • ЬЛп

(11.4.26)

Коэффициенты btj квадратичной формы определяют ее свойства. Квадратичная форма называется положитель­ но определенной, если она всюду, т. е. при любом X Ф О, положительна:

(£ Х )> 0

(11.4.27)

кроме начала координат X 0, где она принимает нулевое значение. Очевидно, что положительная определенность

квадратичной формы моделирует наличие минимума в объекте. Рассмотрим, какие условия налагаются при этом на коэффициенты матрицы В.

Для того чтобы квадратичная форма была положитель­ но определенной [11.2], необходимо и достаточно, чтобы

Рис. 11.4.6. Пример квадратичиои модели = 0).

все диагональные определители матрицы В были строго положительны, т. е.

Ьц &12 • • •

^kl а • • • bkk

В случае моделирования максимума квадратичная форма должна быть отрицательно определенной, т. е. быть отрицательной всюду, кроме начала координат. На ее параметры при этом налагаются следующие условия:

D1< 0; D%> 0; D3< 0;

( -1 )nDn > 0. (11.4.29)

Положительно определенная квадратичная форма в про­ странстве параметров имеет поверхности равного уровня q (хх, ., хп) — const в виде концентрических эллипсо­ идов с центром в начале координат, ориентация которых в пространстве параметров может быть произвольной (рис. 11.4.6). Часто представляет интерес определить направления главных осей этих эллипсоидов. Делается это следующим образом,

Квадратичная форма считается приведенной к глав­ ным осям, если она имеет вид

g(Êi, in) = h l l + b , l t + + &«& (11.4.30)

где bt (i = 1 ,

., n) — характеристические

числа мат­

рицы В. Эти числа являются корнями уравнения

 

Яц —h

 

 

. аin

 

 

 

 

аа1

22

 

 

 

 

 

 

й

— X . . . а<1П

=

0.

(11.4.31)

 

 

 

 

 

 

ЯП1

й,п2

• Япп X

 

 

 

Это уравнение является полиномом п-то порядка отно­ сительно X и имеет п корней, которые и определяют ка­ нонический вид квадратичной формы (11.4.23).

Если квадратичная форма положительно определен­ ная, то все ее характеристические числа больше нуля, т. е. bt > 0 (i = 1, ., re). Действительно, если хотя бы одно из них, например bj, было отрицательным, то, пола­

гая g,, =

• • =

i,-i

= ii+i =

= in = 0 и \j Ф О,

получим

g (|1?

.,

£п) <] 0, что

противоречит определе­

нию положительной определенности квадратичной формы. Таким образом, процедура приведения квадратичной формы к главным осям позволяет свести квадратичную модель (11.4.20) к эллиптической (11.4.30). Действи­ тельно, линейные члены в выражении (11.4.20) не изме­ няют формы поверхностей равного уровня q (хг, ., хп) = = const, а лишь смещают их в пространстве параметров, не меняя при этом ориентации главных осей. Отбрасывая линейные члены, мы смещаем экстремум в начало коор­ динат. Далее, приведя квадратичную форму к главным

осям, получаем эллиптическую модель (11.4.30).

§ 11.5. Идентификация объектов оптимизации

Под идентификацией объекта понимается процесс определения его математического описания, т. е. создание математической модели объекта. Эта задача в той или иной степени возникает на каждом этапе управления вообще и экстремального управления в частности.

Действительно, для того чтобы осуществить управля­ ющее воздействие, его нужно синтезировать, т. е. принять