Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Системы экстремального управления

..pdf
Скачиваний:
10
Добавлен:
19.11.2023
Размер:
33.28 Mб
Скачать

Дворецкого. Однако при определенных видах показателя качества некоторые из требований (16.4.4) можно снять. Так, для объектов типа квадратичной формы процесс поиска будет сходиться быстрее, если g = const и а — = const, т. е. величины пробных и рабочих шагов не уменьшаются. Это связано с тем, что квадратичная форма гарантирует несмещенность оценки (16.5.2), о чем говори­ лось в § 15.1. С другой стороны, градиент квадратичной формы уменьшается по мере приближения к цели, что и обеспечивает сходимость поиска.

Как видно, априорные сведения об объекте могут зна­ чительно убыстрить сходимость процедуры стохастической аппроксимации.

Метод стохастической аппроксимации гарантирует отыскание точного положения экстремума функции ка­ чества в обстановке помех при N оо. Однако при реше­ нии практических задач такой необходимости пет. Реаль­ ные задачи всегда решаются с конечной точностью — нужно попасть в заданный район цели. Это заставляет модифицировать метод, изменяя характер зависимостей

O .N = f (N) и gN = ф (N).

Методы случайного поиска отличаются от регулярных (детерминированных) методов оптимизации намеренпым введением элемента случайности. Это означает, что в од­ ной и той же обстановке решение о направлении рабочего шага, принятое по методу случайного поиска, будет раз­ ным. Однако подобное «случайное» поведение является не только целесообразным, но в большом числе случаев и более эффективным, чем регулярное поведение.

Метод случайного поиска является прямым развитием известного метода проб и ошибок, когда решение ищется случайно, и при удаче принимается, а при неудаче отвер­ гается с тем, чтобы немедленно снова обратиться к слу­ чайности как к источнику возможностей. Такое «случай­ ное» поведение разумно опирается на уверенность, что случайность содержит в себе все возможности, в том числе и искомое решение во всех его вариантах.

Метод проб и ошибок является универсальным методом решения задач при недостаточной априорной информации об объекте. Он моделирует случайный поиск, имеющий место в природе, которую по праву можно считать изобре­ тателем случайного поиска.

Одним из проявлений эффективного случайного поиска в природе являются законы эволюции, открытые Ч. Дарвиным,— естественный и искусственный отбор. Здесь элемент случайности проявляется в виде мутаций, которые имеют случайный характер. Эти мутации могут либо улуч­ шить, либо ухудшить приспособительные свойства особи. В первом случае эта особь имеет больше шансов на выжи­ вание и, следовательно, на закрепление полученной мута­ ции в потомстве, чем во втором. Так, случайные мутации с последующим отбором (искусственным или естественным) являются могучим фактором прогресса в живой природе. А это не что иное, как случайный поиск.

§ 17.1. Гомеостат Эшби

Первым прибором, работающим по методу случайного поиска, был гомеостат Эшби, предложенный и построен­ ный им в 1948 г. [17.1, 17.2]. Гомеостат состоял из четырех

блоков, каждый из которых (рис.

17.1.1)

представлял

собой динамическую

систему вида

 

 

 

 

 

cLx»

... +

ai4x4 (i =

1,..., 4),

(17.1.1)

-gp = <**1*1. +

где Xi — выход i-го блока, а а.ц (/ =

1 ,

., 4)

его па-

раметры. Все переменные

гомеостата

ограничены:

а ^

 

 

< a = i < 6

(i = 1

,

., 4),

т. е.

 

 

в процессе его функциониро­

 

 

вания переменные

не могут

 

 

выходить

за

определенные

 

 

пределы.

 

 

 

 

 

 

 

Таким образом, поведение

 

 

гомеостата

описывалось

си­

 

 

стемой

дифференциальных

 

 

уравнений:

 

 

 

 

Рис. 17.1.1. Схема первого блока гомеостата.

= АХ, (17.1.2)

где

X

(xlt х2, х3, х4) — вектор

состояния гомеостата,

А =

I ау

I — квадратная матрица

его параметров, ко­

торая в значительной степени определяет характер пове­ дения гомеостата. Все множество возможных матриц {А} можно подразделить на два класса: класс устойчивых матриц, которые делают гомеостат устойчивой системой,

икласс неустойчивых матриц (в противном случае). Задача заключалась в том, чтобы подобрать такие зна­

чения параметров гомеостата (ап , а12, . ., а44), т. е. найти такую матрицу А, при которой он был бы устойчив. Из теории обыкновенных линейных дифференциальных урав­ нений известно, что для этого достаточно, чтобы все корни уравнения

бц —

Я»

6jj

6j3

бц

й21

й22 — Я<

Û23

 

0>ZX

 

®32

®33 — Я»

®34

Д41

Д42

Д43

Д44 — Я.

параметров. Положительная реакция R+ следует за вы­ полнением в объекте цели управления, т. е. при устойчи­ вой реакции гомеостата. Она сохраняет в объекте те па­ раметры, которые привели к достижению цели. Алгоритм такого поведения удобно записать так:

при R ,

(17.1.7)

при R

Как легко заметить, такой алгоритм работы системы во­ обще и гомеостата в частности имеет целесообразное пове­ дение, направленное на поиск и сохранение в системе стабильного состояния, которое обеспечивает положи­ тельная реакция 7?+. Этот алгоритм естественно назвать алгоритмом с «наказанием» случайностью, так как слу­ чайное воздействие S вводится как реакция на неудачу в процессе управления.

Таким образом, смысл и содержание рассмотренного алгоритма случайного поиска заключается в том, чтобы случайно перебирать параметры системы до тех пор, пока не будут найдены такие, которые обеспечивают выполнение заранее сформулированных условий. В случае гомеостата таким условием является отыскание устойчивого состояния системы. Очевидно, что такой способ поведения представ­ ляется наиболее целесообразным в том случае, когда у управляющего устройства нет никаких сведений о струк­ туре объекта, т. е. он представляет собой «черный ящик».

Однако для работы этого алгоритма необходимо фор­ мально определить, что считать устойчивой и неустойчи­ вой работой гомеостата. Известно, что система однородных дифференциальных уравнений вида (17.1.1) имеет един­ ственное устойчивое решение хг — хг = х3 = ж4 = 0. Поэтому в основу критерия устойчивости можно положить

величину отклонения

от

устойчивого состояния

 

 

 

 

 

4

 

(17.1.8)

 

 

 

 

 

 

Теперь, задав

порог

Ô

0,

можно

при Q < ô

систе­

му считать

устойчивой,

а

при Q^>b — неустойчивой

(см. рис. 17.1.2, где заштрихована

устойчивая

в этом

смысле зона).

 

 

 

 

 

 

Заметим, что такое определение устойчивости условно,

так как при Q

Ôсистема может быть уже неустойчивой,

а при Q

Ô может быть устойчивой (см. рис. 17.1.2).

Однако эти

случаи можно исключить, если управле­

ние сделать не мгновенным, а инерционным, т. е. реагиро­ вать на состояние системы не мгновенно, а через некоторое время наблюдения. За это время переходные процессы в системе затухнут и указанный критерий будет объек­

тивно отражать состояние

системы.

Сформулированный алгоритм работы гомеостата можно

записать в виде

при <)(X )>ô,

[ S

"+1" 1 4

(17.1.9)

при Q (X) < Ô.

Естественно теперь задать вопрос: всегда ли можно найти параметры, при которых гомеостат окажется устой­

чивым, т. е. возможно ли

 

х2

случайным перебором пара­

 

//////у 7 ,

метров достигнуть

устойчи­

'/////>

вости всегда и наверняка?

1

6 9

Для ответа на этот вопрос

разобьем множество всех воз­

.

можных реализаций парамет­

 

ров гомеостата на

два под­

%

множества {4°} и {Л*}, в

//717 7 7 7 // 7 7 7 7 7 7 //

первое из которых объедине­

нызначения параметров, при­

 

 

водящие к неустойчивости, а

Рис. 17.1.2. Пространство пе­

во второе — вызывающие по­

ременных гомеостата.

ложительную реакцию, т. е.

обеспечивающие устойчивость гомеостата. Решение за­ дачи заключается, таким образом, в случайном отыскании хотя бы одного элемента второго множества за конечное число шагов поиска (под шагом поиска здесь подразуме­ ваются однократный случайный выбор параметров гомео­ стата и определение, к какому классу они относятся, т. е. проверка устойчивости). Ясно, что для этого необходимо, чтобы оба подмножества были примерно одинаковы. Это означает, что при случайном переборе всех возможных параметров «представители» подмножества {Л*} должны встречаться не слишком редко. Тогда при случайном пе­ реборе элементов множества всех возможных параметров

вероятность выбора хотя бы одного

из элементов

это­

го подмножества будет конечна.

Следовательно,

по

вероятности процесс поиска закончится в конечное время и гомеостат обязательно придет в устойчивое состояние.

Представим работу гомеостата как функционирование некоторого стохастического автомата, действующего в слу­ чайной среде. С точки зрения управления гомеостат следует «расслоить» на среду и управляющее устройство УУ (рис. 17.1.3). Под средой здесь подразумевается динами­ ческая система (17.1.2), а управляющее устройство рабо­ тает в соответствии с алгоритмом случайного поиска (17.1.8). Динамическую систему следует привести в устой­

 

чивое состояние X*, незави-

 

X* симо от действия случайного

С р е д а

фактора Е.

 

А

Алгоритм случайного по-

иска (17.1.9),

реализуемый

Q

УУ

управляющим

устройством

 

гомеостата, является стохас­

Рис. 17.1.3. Представление го­

тическим автоматом, выход

меостата в виде автомата, дей­

которого А изменяется в за­

ствующего в случайной среде.

висимости от состояния вхо-

да Q. Стохастическая матрица, характеризующая функцио­

нирование этого автомата в случайной среде,

имеет вид

 

R-

1 - P

Р

(17.1.10)

 

R+

О

1

 

 

где

Р — вероятность отыскания

устойчивого решения,

удовлетворяющего поставленным целям

управления

(Q ^

Ô). Эффективность

функционирования

гомеостата,

очевидно, существенно зависит от величины Р. Чем боль­ ше Р, тем быстрее находится решение и тем эффективнее работает гомеостат.

Стохастический характер поведения гомеостата, как видно, определяется двумя факторами: оператором слу­ чайного шага S и неопределенностью среды, которая зависит от неизвестного случайного фактора ситуации Е.

Граф алгоритма работы гомеостата показан на рис. 17.1.4. Здесь кружками обозначены события — поло­ жительная и отрицательная реакции, а стрелками — условные переходы между ними. В скобках записаны усло­ вия этих переходов. Пунктирная стрелка показывает пере­ ход, не предусмотренный алгоритмом и соответствующий

потере устойчивости гомеостата за счет случайного воз­ действия Е.

Отметим, в заключение, некоторые характерные осо­ бенности алгоритма управления гомеостатом/: В этом управлении имеются два резко противоположных режима работы поиска. В первом, «наказуемом», системе предла­ гаются различные случайные варианты управления. Этот процесс продолжается до тех пор, пока не будет найдено удовлетворительное решение ((? ^ Ô), после чего включа­ ется второй режим, когда в виде «поощрения» система сохраняет найденные в первом режиме параметры.

Щ > 9 )

Рис. 17.1.4. Граф алгоритма гомеостата (линейная тактика).

Будем такой способ поведения называть линейным, а тактику такого поиска — линейной тактикой.

Как видно, линейная тактика отличается сохранением того управления, которое привело к успеху. Эта тактика имеет несколько «педантичный» характер, но вполне ра­ зумна и обоснованна при управлении не слишком слож­ ными системами (под сложностью в данном случае подра­ зумевается не число параметров, а структура задачи). В большинстве случаев линейная тактика управления приводит к эффективным результатам.

§ 17.2. Случайный поиск с линейной тактикой

Линейная тактика, как сказано выше, отличается тем, что действие, которое привело к удаче, сохраняется и далее. Применим эту тактику для оптимизации объекта.

Одним из алгоритмов случайного поиска, использую­ щего линейную тактику, является гомеостатический поиск построенный по алгоритму гомеостата (17.1.9)

Здесь определяется такой вектор оптимизируемых пара­ метров X*, который обеспечивает выполнение неравенства

Q (X *) < Ô,

(17.2.2)

где Ô — заданное число,

S — случайный

вектор,

S = (?„

Ы ,

(17-2.3)

распределенный равномерно в зоне допустимых парамет­ ров, т. е. S G S.

Гомеостатический поиск представляет собой случайное сканирование и его целесообразно применять только тогда, когда вероятность Р отыскания решения, удовлет­ воряющего неравенству (17.2.2), достаточно велика. Эта вероятность определяет среднее число шагов случайного поиска, необходимых для решения задачи:

ЛГср=-р--

(17.2.4)

Как видно, при малых значениях вероятности Р среднее число шагов поиска велико.

Рассмотрим пример применения этого алгоритма — один из способов решения системы линейных алгебраиче­ ских уравнений:

П

/^1

===Cj

(/ ==

•••» Гг),

(17.2.5)

i= l

где ац и cj (i, / = 1, . ., гг) — заданные величины, — неизвестные. Образуем функцию невязки

п

п

 

Q(X)= 2

( 2 а д - ^ ) -

(17.2:6)

3=1 i= 1

минимум которой равен нулю и, следовательно, соответствует решению задачи X*. Уравнение

Q (X) = Ô

(17.2.7)

определяет гиперэллипсоид в пространстве искомых пере­ менных {X}. Если теперь взять точки Xi (i = 1, . т\, равномерно распределенные внутри этого гиперэллип­ соида:

Я (Xi) < 8

(i = 1,

m),

(17.2.8)

то их среднее определяет центр гиперэллипсоида и, сле­ довательно, является оценкой решения X*:

т

Я .* =

~ S X,.

(17.2.9)

 

г= 1

 

Очевидно, что в пределе при т

оо среднее (17.2.9)

является точным решением

 

X* =

lira Т т.

(17.2.10)

 

771—>00

 

Задача, таким образом, сводится к отысканию случайных точек Xi, удовлетворяющих неравенству (17.2.8). Это проще всего сделать, используя случайный поиск, рас­ смотренный выше. Успех этого поиска в значительной мере определяется величиной вероятности Р. Если она мала, то целесообразность применения этого алгоритма

следует

ставить под сомнение.

При

отыскании минимума заданной функции Q =

= Q (X)

для целей экстремального управления приме­

нение этого алгоритма явно не оправдано, так как связано с большими временными затратами. Причина этого заклю­ чается в том, что рассмотренный гомеостатический алго­ ритм случайного поиска решает вопрос об отыскании ре­ шения в принципе. Он лишь гарантирует конечность вре­ мени отыскания решения. Вопросы же быстродействия не решаются этим алгоритмом, так как он предназначен для управления объектами самого широкого класса с един­ ственным ограничением, связанным с конечностью вероят­ ности отыскания решения.

Однако в задачах экстремального управления часто имеются дополнительные сведения об объекте, напримёр о характере поведения его показателя качества при”раз­ личных управлениях. Эта информация дает возможность применить новые алгоритмы управления, уже решающие вопросы быстродействия с учетом имеющихся дополни­ тельных сведений об объекте. Такие дополнительные све­ дения об объекте оптимизации, прежде всего, несет его функция качества Q (X), которую требуется минимизи­ ровать. Нетрудно заметить, что сведения о гладкости ги­ перповерхности Q — Q (X) могут помочь в значительной степени убыстрить процесс оптимизации, так как при этом