![](/user_photo/_userpic.png)
книги / Системы экстремального управления
..pdfОн |
равен |
|
|
|
|
(11.3.13) |
|
ÀÇmax = |
8 1/"а \ + |
„2 |
|
||
|
Ой |
|
|
|||
и соответствует направлению |
|
|
|
|||
е = |
(cos ф*, sin ф*) = / — j. ai —=~ • — г Д2 |
\ |
(11.3.14) |
|||
где |
\ V at + < |
V < + < ) ' |
|
|||
* |
|
, Д2 |
|
|
|
|
|
= |
|
|
(11.3.15) |
||
|
Ф |
arctg — . |
|
Пусть вектор градиента по первому определению равен grad'Ç (X) = (6 Х, Ьа). (11.3.16)
Тогда его модуль по определению равен
|grad'<?(X)| = / ï f + ^ = - ^ i = Vr“f+ ^ . (Н.3.17)
а направлен он вдоль вектора е (11.3.14), т. е.
grad' Q (X) = |
а\ + ai е. |
(11.3.18) |
|||
Таким образом, получаем для его компонент |
|
||||
Ьх = |
|/~ ах + а\ cos ф* = |
ах, |
(11.3.19) |
||
Ьг — |
af -j- al s i n Ф* = |
aii |
|||
|
|||||
T . G . |
|
grad Q (X) |
(11.3.20) |
||
grad'Ç (X) = |
и оба определения градиента идентичны. (Аналогичные рассуждения позволяют распространить это утверждение
на общий случай п >= 2 |
.) |
|
Определим соотношение между линией равного уровня |
||
и градиентом. |
|
|
Уравнение прямой, касательной к линии равного |
||
уровня в точке Х 0, имеет вид |
|
|
ах (хх — xl) + |
а2 {х2 — а£) + <?о = с. |
(11.3.21) |
Наклон этой прямой к оси хх равен |
|
|
Ъ |
- ~ “ . |
(11-3.22) |
Наклон вектора градиента к оси хх равен |
(11.3.15) |
*, = tg<f = V - |
(11.3.23) |
А так как |
(11.3.24) |
кх-к2 = —1, |
то градиент ортогонален к касательной линии равного уровня.
На рис. 11.3.6 показаны примеры линий равного уровня с нанесенными градиентами. Как видно, векторы
Рис. 11.3.6. Соотношение меж- |
Рис. 11.3.7. Пример градиепт- |
ду линиями равного уровня и |
пых линий, |
градиентом. |
|
ортогональны к линиям равного уровня и по модулю обратно пропорциональны расстоянию между этими ли ниями.
Еслидвигаться вдоль градиентного направления, отсле живая его в каждой точке траектории, то получается линия, называемая градиентной. На рис. 11.3.7 пока заны примеры антиградиентных линий, двигаясь вдоль которых можно быстро попасть в минимум.
§11.4. Модели многопараметрических объектов
•Рассмотрим несколько наиболее типичных моделей многопараметрических объектов. В качестве таких моде
лей можно предложить функции определенного вида. Отличительным свойством этих функций является то, что они отражают различные особенности связи между вхо дом и выходом реальных экстремальных объектов. Про стейшей является линейная функция.
|
А. Линейная модель. |
Она |
имеет вид |
|
||
|
<?(X) = |
Ç0 + U , |
X I |
(11.4.1) |
||
где |
Qo = Q (0); А = |
(а1} |
а2, |
•> |
я»») — вектор |
парамет |
ров |
модели. Здесь |
квадратными |
скобками обозначено |
Рис. 11.4.1. Линин равного уровня линейного объекта.
скалярное произведение. В скалярной форме линейная функция записывается так:
Q (X) — Qo + агхх + а2х2 + |
+ апхп. (11.4.2) |
Как видно, вектор А этой функции совпадает с ее гра диентом
grad Q = А. |
(11.4.3) |
Следовательно, при А = const градиент линейной модели не зависит от положения системы X. На рис. 11.4.1 по казан характер поведения поверхностей равного уровня Q (X) = const, которые для линейной формы являются гиперплоскостями.
Линейная модель хорошо описывает гладкие объекты в малой окрестности. Действительно, разложим функцию качества объекта Q (X) в ряд Тейлора в окрестности точки Х0 и ограничимся линейными членами разложения:
<? (X) = Ç (Х„) + -Ц -1_ _ (*, |
-Со)- |
|
х \ |
) + • • • |
|
х=х. |
3Q |
|
|
(хп — л40)). (1 1 .4.4) |
|
|
дх„ |
|
|
Х=х„ |
Как видно из этого выражения, при Х 0 = 0 оно совпадает с (11.4.1). Это означает то, что линейное представление (11.4.1) возможно для любой достаточно гладкой функции качества в малой окрестности исходной точки (гладкость здесь необходима для того, чтобы можно было ограни читься линейным приближением).
Линейная модель применяется обычно при исследо
вании |
поведения локальных алгоритмов поиска вдали |
|||
от экстремума, где |
поверх |
|
||
ности равного уровня имеют |
|
|||
уплощенный характер. |
|
|||
Б. Центральная |
модель. |
|
||
Для |
моделирования поведе |
|
||
ния объекта в районе экстре |
|
|||
мума |
X* часто применяется |
|
||
центральная модель, которая |
|
|||
представляется в виде |
|
|||
Q(X) |
= |
Q* + f ( \ X - X * I), |
|
|
где Q* - |
|
(11.4.5) |
рис> ц 4 2. Линии равного |
|
экстремальное зна- |
УР°ВНЯ Центрального объекта, |
|||
чение |
Q * — Q (X*); |
/(•) — |
|
неубывающая функция, равная нулю в экстремуме: /( 0 ) =
= |
0. На рис. 11.4.2 показаны поверхности равного уров |
|||||||
ня |
этой модели — это концентрические |
окружности. |
||||||
|
Наиболее |
распространены |
следующие |
конкретизации |
||||
центральной |
модели: |
|
|
|
|
|
|
|
|
|
Q СЮ = |
<?* + |
/с | X — |
X * |, |
|
(11.4.6) |
|
|
|
Q (X) = |
Q* + |
к (X - |
X* ) 2 |
|
||
|
|
|
|
|||||
или в скалярной форме |
п |
|
|
|
|
|||
|
|
|
|
|
|
|
(11.4.7) |
|
|
|
< ? № = « • + * |
(2 |
t o - * ) * ) * . |
||||
|
|
|
|
П |
|
|
|
|
|
|
е(Х) = < ? * + * 2 & |
|
|
(11.4.8) |
|||
|
|
|
|
Î=I |
|
|
|
|
Выражение |
для центральной |
модели удобно |
записать |
|||||
в следующей форме: |
|
|
|
|
|
|
||
|
|
Q (X) = |
<?* |
+ / |
(г), |
|
(11.4.9) |
![](/html/65386/197/html_L2jyhpZV6N.nFYO/htmlconvd-co9Azw305x1.jpg)
где г = | X — X* | — расстояние до цели в пространстве оптимизируемых параметров {X}. Как видно, значение показателя качества этой функции зависит только от расстояния до цели г.
Рис. 11.4.3. Модели |
центральных функций качества: |
а) конус, |
||||||
|
|
|
6) |
параболоид вращения. |
|
|
||
|
Градиент центральной модели |
равен |
|
|
||||
|
|
|
grad Q (X) = |
Г (1 * -**!> (X - |
X*) |
(11.4.10) |
||
и |
для |
рассмотренных |
частных |
случаев |
получаем при |
|||
/ |
(г) = |
кг |
|
|
|
|
|
|
|
|
grad Ç(X) = -£-(X — X*) = к dir (X - |
X*), |
(11.4.11) |
||||
при |
/(г) = кг2 |
|
|
|
|
|
||
|
|
|
grad Q (X) = 2к{Х — X*), |
(11.4.12) |
||||
где |
dir |
знак направления: |
|
|
|
t o Z = T f p
Как видно, первая модель (11.4.11) имеет постоянный модуль градиента (это конус, двумерный случай кото рого приведен на рис. 11.4.3, a), a градиент второй модели (11.4.12) увеличивается по мере удаления от экстремума
(это — |
равноосный |
параболоид, двумерный случай |
ко |
торого |
показан на |
рис. 11.4.3, б). |
оо, |
При значительном удалении от цели, т. е. при г |
|||
центральная модель |
вырождается в линейную. Действи |
в районе цели. Наиболее распространенная форма эллип
тической модели получается при / (у) = |
у и X — 0 |
N |
|
Q (х) = 2 hx\. |
(11.4.17) |
t=i |
|
Однако и эта модель не отражает всех особенностей пове
|
|
дения |
объекта |
в |
районе |
||||
|
|
цели. |
Более |
общий |
вид |
||||
|
|
имеет |
так называемая |
||||||
|
|
Г. |
Сепарабельная |
мо |
|||||
|
|
дель. Она отличается вза |
|||||||
|
|
имной разделимостью дей |
|||||||
|
|
ствия |
каждого |
из |
пара |
||||
|
|
метров: |
П |
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
<? (X) = |
2 |
A te - |
*0. |
||||
|
|
|
|
|
|
|
(11.4.18) |
||
|
|
где fi (•) |
(i = |
1, |
|
|
п) — |
||
функции с минимумом в начале координат. |
|
|
|
||||||
Пример |
сепарабельной |
модели |
вида |
|
|
|
|
||
|
Q (X) = |
| хг | + |
4 |
|
|
|
(11.4.19) |
||
показан на |
рис. 11.4.5. |
|
|
вид модели, |
когда |
||||
Теперь |
рассмотрим более общий |
имеется перекрестное влияние параметров. Наиболее про стой моделью этого типа является
Д. Квадратичная модель. Она записывается в виде
Q (X ) = Q* + 1А,Х] + [X, (ВХ)]. (11.4.20)
Здесь А = (а1( . ., ап), квадратными скобками обозна чено скалярное произведение, В — квадратная матрица вида
Ьц &12 •. • Ь1п о &21 Ьц ... Ь2п
квадратичной формы моделирует наличие минимума в объекте. Рассмотрим, какие условия налагаются при этом на коэффициенты матрицы В.
Для того чтобы квадратичная форма была положитель но определенной [11.2], необходимо и достаточно, чтобы
Рис. 11.4.6. Пример квадратичиои модели (А = 0).
все диагональные определители матрицы В были строго положительны, т. е.
Ьц &12 • • •
^kl а • • • bkk
В случае моделирования максимума квадратичная форма должна быть отрицательно определенной, т. е. быть отрицательной всюду, кроме начала координат. На ее параметры при этом налагаются следующие условия:
D1< 0; D%> 0; D3< 0; |
( -1 )nDn > 0. (11.4.29) |
Положительно определенная квадратичная форма в про странстве параметров имеет поверхности равного уровня q (хх, ., хп) — const в виде концентрических эллипсо идов с центром в начале координат, ориентация которых в пространстве параметров может быть произвольной (рис. 11.4.6). Часто представляет интерес определить направления главных осей этих эллипсоидов. Делается это следующим образом,
Квадратичная форма считается приведенной к глав ным осям, если она имеет вид
g(Êi, in) = h l l + b , l t + + &«& (11.4.30)
где bt (i = 1 , |
., n) — характеристические |
числа мат |
|||||
рицы В. Эти числа являются корнями уравнения |
|||||||
|
Яц —h |
|
|
. аin |
|
|
|
|
аа1 |
22 |
|
|
|
|
|
|
|
й |
— X . . . а<1П |
= |
0. |
(11.4.31) |
|
|
|
|
|
|
|||
|
ЯП1 |
й,п2 |
• Япп X |
|
|
|
Это уравнение является полиномом п-то порядка отно сительно X и имеет п корней, которые и определяют ка нонический вид квадратичной формы (11.4.23).
Если квадратичная форма положительно определен ная, то все ее характеристические числа больше нуля, т. е. bt > 0 (i = 1, ., re). Действительно, если хотя бы одно из них, например bj, было отрицательным, то, пола
гая g,, = |
• • = |
i,-i |
= ii+i = |
= in = 0 и \j Ф О, |
получим |
g (|1? |
., |
£п) <] 0, что |
противоречит определе |
нию положительной определенности квадратичной формы. Таким образом, процедура приведения квадратичной формы к главным осям позволяет свести квадратичную модель (11.4.20) к эллиптической (11.4.30). Действи тельно, линейные члены в выражении (11.4.20) не изме няют формы поверхностей равного уровня q (хг, ., хп) = = const, а лишь смещают их в пространстве параметров, не меняя при этом ориентации главных осей. Отбрасывая линейные члены, мы смещаем экстремум в начало коор динат. Далее, приведя квадратичную форму к главным
осям, получаем эллиптическую модель (11.4.30).
§ 11.5. Идентификация объектов оптимизации
Под идентификацией объекта понимается процесс определения его математического описания, т. е. создание математической модели объекта. Эта задача в той или иной степени возникает на каждом этапе управления вообще и экстремального управления в частности.
Действительно, для того чтобы осуществить управля ющее воздействие, его нужно синтезировать, т. е. принять