Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Системы экстремального управления

..pdf
Скачиваний:
10
Добавлен:
19.11.2023
Размер:
33.28 Mб
Скачать

осей:

 

А

 

 

 

J ^ ^ U r ( X +

eA )-fr(X )],

(15.2.14)

где

ei —единичный вектор,

направленный

вдоль i-й

оси,

Д { —величина пробного шага вдоль i-й оси.

Определение оценки градиента ограничений не тре­ бует дополнительных измерений и может производиться одновременно с оценкой градиента показателя качества объекта.

Единственная трудность, связанпая с применением метода проецированного градиента, заключается в необ­ ходимости довольно сложных вычислений, особенно при нарушении большого числа ограничений, что всегда за­ труднительно при аппаратурной реализации метода.

§ 15.3. Работа метода градиента в обстановке помех

При наличии случайных помех, накладывающихся на показатель качества объекта, метод градиента даже при линейной функции качества дает лишь приближенную оценку градиентного направления. Будем для простоты рассматривать линейный объект, для которого шаговая оценка градиента при отсутствии помех дает точное зна­ чение градиента. При наличии помех получаем для поиска с центральной пробой

А

 

-Üf = 7 '\Q ' (X + ее>) - <?' (X)] =}[<? (X + ge,) -

Q (Х)]+

+ а -е_, (i = 1 .......B)i

(153д)

где Q' — значение показателя качества при наличии по­ мех, которые накладываются на истинное значение Q-.

Q' (Хг) = Q (Xi) + e f.

(15.3.2)

8f (i = 0, 1 , ., n) —случайная помеха, накладываю­ щаяся на показатель качества. Будем считать, что эта помеха независимая и имеет нормальный закон распре­ деления с нулевым математическим ожиданием и диспер­ сией а2. Обозначим это обстоятельство выражением

е = е (о) = ое (1),

(15.3.3)

Рис. 15.3.1. Взаимодействие векторов градиента и помехи в процессе точечного оцени­ вания градиента.

где в скобках стоит значение среднего квадратического отклонения. Теперь (15.3.1) в линейном поле можно записать в виде

9Q' _

dQ

(i =

1 , . . п)

(15.3.4)

дх\

дх{ '

 

 

 

и в векторной

форме

 

 

 

grad Q' = grad Q + ^ Ь

Е (1),

(15.3.5)

где Е (1) — n-мерный случайный вектор помехи, компо­ ненты которого являются нормально распределенными случайными числами с единич­ ной дисперсией:

Е (1) = (ех (1),

еп (1)).

 

(15.3.6)

Как видно, шаговая оценка градиента получается в резуль­ тате сложения точного значения градиента и случайного вектора помехи (рис. 15.3.1). Эта карти­ на не зависит от выбора системы

координат. Поэтому без ущерба для общности будем счи­ тать, что градиент направлен вдоль оси хх:

Теперь

grad Q = (/с,

0,

0,

.,

0).

(15.3.7)

 

 

 

 

 

 

 

 

 

к + - ^ Г ~

8 i(l)

Д Л Я

1 =

1,

 

 

 

&

g

 

 

 

 

 

 

(15.3.8)

 

 

 

 

 

 

 

дх{

у ъ

Ei(l)

для

i=f=l

(i =

2 , . . . , п).

 

 

 

g

Косинус угла ф между градиентом grad Q и его оценкой

grad Q характеризует эффективность оценки. Действи­ тельно, чем больше cos ф, тем меньше ф и тем ближе оцен­ ка совпадает с градиентом. Но

cos ф = [grad'Q/grad'Q'1.

(15,3,9)

к | grad Q' |

 

Учитывая (15.3.7) и (15.3.8),

получим

 

/

2ogi(l)

 

cos ф = ---- ----------.

(15.3.10)

I grad Q' I

 

Из этого выражения видно, что при помехе ех (1) меньше,

чем — kg/Y2о величина cos г|) становится отрицательной, т. е. оценка градиента неэффективна и рабочий шаг в этом направлении следует считать ошибочным. Определим вероятность такого события:

Вер [MD < - - jfe ] - 4 [‘ -

ф (Й)] ■ <15-311>

где Ф —функция Лапласа. Величину

 

* 4

(15.3.12)

обычно называют параметром зашумленности объекта.

Он характеризует степень влияния случайных помех

иравен отношению уровня помехи (а) к уровню полез­ ного сигнала (kg). Чем больше значение этого параметра, тем большую роль играют помехи. И наоборот. При малом

хпомехами в системе можно пренебречь. Однако и малое

ибольшое значение параметра зашумленности вовсе не говорит только о малом и соответственно большом уровне случайных помех (шумов) в объекте. Это может свиде­ тельствовать о большом или малом полезном сигнале, который в данном случае равен произведению модуля градиента к на величину пробного шага g.

Сучетом (15.3.12) получаем для вероятности ошибки при градиентном методе в обстановке помех следующее выражение:

Рои. = у [ 1 - ф (к)] ■

(15.3.13)

которое показано на рис. 15.3.2 (гдеследуетположить т= 1). Наглядно видно, что с ростом зашумленности % вероят­ ность ошибки стремится к 1 /2, т. е. оценка градиента становится чисто случайной, чего и следовало ожидать. Любопытно, что вероятность ошибки не зависит от раз­ мерности объекта п.

Рассмотрим меры, которые можно предпринимать, что­ бы снизить вероятность ошибочного шага. Значения мо­ дуля градиента к и дисперсии случайной помехи а2 изме­ нять нельзя — они определяются самим объектом. Но, увеличивая величину пробного шага g, можно понизить уровень помехи к (15.3.12). Это является одной из самых эффективных мер по уменьшению влияния помех на про­ цесс поиска. Но возможен и другой способ — накопление.

Накопление в процессе поиска заключается в повтор­ ном определении показателя качества в одном и том же

Рис. 15.3.2. Зависимость вероятности ошибки от зашумленности объекта при различных объемах накопления.

состоянии. Пусть Qi (X j) — результат г-го замера пока­ зателя качества в /-м состоянии:

Qi (X ,) = Q (X,) + 6, (а),

где е{ (а) —помеха в г-м измерении. Сделав т измерений и осреднив их, получаем

т

Q'cр(X,) = 4 - 3 <?'•№) = <? (X,) + гр= 8(1), (15.3.14)

откуда хорошо видно, что такой мерой случайную помеху удалось уменьшить в / т раз. Поэтому то-кратное нако­ пление позволяет снизить зашумленность в У то раз. Вы­ ражение для вероятности ошибки при поиске по методу градиента в этом случае записывается в виде

Эта зависимость показана на рис. 15.3.2. Однако вероят­ ность ошибки является не единственной характеристикой поиска. Другой ваяшой характеристикой поиска следует считать среднее смещение к цели, которое пропорцио­

нально среднему значению cos ф, т. е. cos ф. Если гра­ диентный поиск сводится к единичному шагу в направ­ лении, обратном направлению шаговой оценки градиента,

то cos ф в точности равно среднему смещению систе­ мы за один рабочий шаг в градиентном направлении. Чем ближе оно к единице, тем эффективнее поиск.

При cos ф = 0 поиск не

работает, а при cos ф < О происходит расстройка объекта.

Рис. 15.3.3.

Параметр среднего

Получить

величину

смещения к цели sa один цикл

совф можно, осреднив cos ф

градиентного

поиска

в функции

зашумленности.

(15.3.10) по всем

возмож­

 

 

 

ным реализациям

помех

еt (i = Q, 1, . ., п). Для этого достаточно взять

(п + 1)-

кратный интеграл

 

 

 

 

оо

оо

оо

 

 

 

 

$

\ cos фр (е„) р (еД... р (&п)

de0. .. den

 

 

 

(15.3.16)

 

 

 

 

где р (е) — плотность распределения помехи

е.

 

Вычисление такого интеграла представляет серьезные

трудности. Поэтому для определения соэф применяют метод статистического моделирования (Монте-Карло), который в данном случае сводится к прямому многократ­

ному моделированию процесса поиска, определению

cos "ф на

каждом рабочем шаге и вычислению среднего

значения

совф по всем рабочим шагам. На рис. 15.3.3

представлены результаты расчетов на ЦВМ [15.2] по

этой

формуле — зависимость средней эффективности

cos ф

от параметра зашумленности для различных зна­

чений

размерности п оптимизируемого объекта. Хорошо

видно, что эффективность поиска падает с ростом зашум­ ленности и размерности, чего и следовало ожидать.

Рассмотрим поведение метода градиента при большей размерности п и при высокой зашумленности х. Для вы­ сокой размерности системы слу­ чайный вектор Е (1) будет в сред­ нем ортогонален градиентному направлению. Действительно, угол наклона <р при случайной ориентации вектора Е в равной степени (равновероятно) может

принимать значения

и ф, и

Рис. 15.3.4. К определению

я — ф, что в среднем дает ф =

средней оценки

градиента.

= я/2 (рис. 15.3.4). Для сред­

Е можно получить при

ней величины модуля

вектора

больших п следующее выражение:

 

М(\Е(1)\)=М

 

V n ^ ï .

(15.3.17)

Теперь нетрудно из прямоугольного треугольника на рис. 15.3.4 оценить среднюю величину наклона

» (l + " У ’Р

=

[ 1 + 4 к > - 1)Г'’, (15.3.18)

и при большем х и п получаем

 

 

совф

1

_

1

(15.3.19)

п 1

2к Y п

2к

 

Это означает, что эффективность метода градиента падает

с ростом размерности п как 1/У п. Если же учесть затра­ ты на пробные п + 1 шагов, необходимые для оценки гра­ диента, то эффективность (назовем ее относительной)

будет пропорциональна 1 /пУ п.

В этом — существенный недостаток метода градиента. Он эффективен лишь для объектов малой размерности. С увеличением размерности п его эффективность быстро падает и при больших значениях п он практически пере­ стает работать. Введение накопления, т. е. повторно­ го., ш-кратного определения показателя качества, не.

улучшает положения, так как при этом соответственно увеличиваются потери.

Действительно, пусть делается m-кратпое накопле­ ние, что приводит к уменьшению параметра зашумлен­

ности в / m

раз. Но число проб при этом равно не п -f- 1,

а т (п + 1 )

и

относительная

эффективность равна

- ^

т

т

~ ------- Ш

1)

(15.3.20)

т (п +

1)

2хт Y п (л +

2ии У п т

т. е. она не только не увеличивается, но даже уменьшается

в Y m раз. Это означает, что введение накопления при методе градиента ухудшает относительную эффектив­ ность метода градиента.

Поэтому накопление при оптимизации методом гра­ диента следует вводить лишь при необходимости сниже­ ния вероятности ошибочных шагов. Быстродействие по­ иска при этом снижается.

§16.1. Адаптация в процессе градиентного поиска

Впроцессе градиентного поиска всегда большую труд­ ность представляет определение величины коэффициента as, который существенно влияет на эффективность поиска (15.1.2). Действительно, при малом значении градиент­ ного шага изменение функции качества также будет небольшим и эффективность оптимизации будет невысо­ кой. Если же величина рабочего шага будет слишком велика, то система будет как бы «перескакивать» экстре­ мум и при этом возможно увеличение показателя каче­ ства. Поэтому величину рабочего шага следует каждый раз выбирать оптимальной. Будем называть величину а оптимальной (а = а*), если любое ее изменение при­ водит к увеличению показателя качества, т. е. это озна­ чает, что а* минимизирует значение функции качества

вдоль направления градиента, определенного в точке X:

Q [X a* grad Q (X)] = min Q [X a grad Q (X)]. (16.1.1)

a>0

На рис. 16.1.1 это проиллюстрировано в виде экстре­ мальной зависимости значения функции качества от величины а.

Как определить а*? Эта величина существенно зави­ сит от вида функции качества и от исходного состояния X. Для точного определения а* необходимо иметь эти данные, которые почти никогда не имеются в процессе поисковой оптимизации (если бы мы располагали такими данными, то потерял бы смысл поиск — ведь экстремум заданной функции можно определить стандартным беспоисковым путем).

Следовательно, величину а* нужно оценивать кос­ венным образом в процессе поиска, т. е. необходимо вос­ пользоваться процедурой адаптации, которая позво­ лит корректировать а на каждом рабочем шаге поиска,

в зависимости от полученной информации. Адаптацию параметра а можно представить в виде следующей рекур­ рентной зависимости:

aN+1 = aN + Fn,

(16.1.2)

где Ад — функция iV-ro шага, характеризующая прямым или косвенным образом от­ клонение от оптимально­ го значения параметра a*N на

N-м шаге поиска.

 

 

 

 

 

Например,

 

 

 

 

 

FN =

ô s ig n ^ — ад), (16.1.3)

 

 

 

 

где sign — функция

знака,

 

 

 

 

Ô— некоторый постоянный

Рис. 16.1.1. К оптимальности

шаг,

â*N — оценка оптималь­

параметра а при

градиентном

ного значения адаптируемого

 

поиске.

 

параметра на N-u шаге по­

 

 

 

 

иска.

 

 

 

Как видно, этот алгоритм адаптации сводится к полу­

чению

оценки

а* или, точнее,

к

определению

знака

(16.1.3).

два

способа

такой

адаптации.

 

Рассмотрим

 

А .

Оценка

знака

(16.1.3) с

применением пробного

шага.

Пусть Q (XN-I + Д А д )

— значение показателя ка­

чества после рабочего шага. Сделаем пробный шаг вели­ чиной g в том же направлении и определим показатель

качества.

Он

равен

Q ( А д _ 1 +

Д А д -f- g dir

Д А д ) =

= Q ( А д +

g dir Д А д ) .

Очевидно, что при малом g имеет

место соотношение

 

 

 

sign \Q (XN-I +

AА д

g dir Д А д )

Q (А д _ х +

 

 

 

+

ДАд)] =

sign [ад — ад].

(16.1.4)

Действительно, увеличение показателя качества означает, что величина ад была слишком большой и ее следует уменьшать. И, наоборот, уменьшение показателя каче­ ства свидетельствует о том, что ад нужно увеличивать.

Алгоритм адаптации в этом случае можно представить в следующей форме:

Яд+i = йглг — ô sign [Q (Ад- -f g dir ДАд) — Q (Ад)]. (16.1.5)

Так как а* все время изменяется, то не имеет смысла го­ ворить о сходимости алгоритма адаптации (16.1.5), так как цель а* сама изменяет свое значение. Но тенденция поведения ап, заданная формулой (16.1.5), позволяет утверждать, что

ап

ап,

(16.1.6)

т. е. в процессе адаптации мы будем приближаться к оп­ тимальному в данных условиях значению параметра а.

Рис. 16.1.2. Поведение градиентного поиска при: а) а

а*,

б) а > а*.

 

Однако этот способ требует введения дополнительной

пробы. Другой способ не

нуждается

в дополнительном

определении показателя качества. Он изложен ниже.

Б. Оценка знака в (16.1.3) путем

определения угла

между рабочими шагами.

Другим

источником оценки

знака неравенств ап ^ ап может служить характер пове­ дения системы в процессе поиска. Если направления двух следующих друг за другом рабочих шагов изменяются мало (рис. 16.1.2, а), то это означает, что рабочие шаги малы и величину а нужно увеличивать. Если же угол <р велик (рис. 16.1.2, б), то очевиден «перескок» через зону экстремума и рабочий шаг следует уменьшать (рис. 16.1.3).

В качестве меры отклонения направления двух шагов выберем косинус угла между ними ср. Эта величина вы­

числяется через скалярное

произведение:

[ M N, ÀZW+1]

COS<PJV+I =

(16.1.7)

\àXnl-\bXN+i\'