книги / Системы экстремального управления
..pdfДворецкого. Однако при определенных видах показателя качества некоторые из требований (16.4.4) можно снять. Так, для объектов типа квадратичной формы процесс поиска будет сходиться быстрее, если g = const и а — = const, т. е. величины пробных и рабочих шагов не уменьшаются. Это связано с тем, что квадратичная форма гарантирует несмещенность оценки (16.5.2), о чем говори лось в § 15.1. С другой стороны, градиент квадратичной формы уменьшается по мере приближения к цели, что и обеспечивает сходимость поиска.
Как видно, априорные сведения об объекте могут зна чительно убыстрить сходимость процедуры стохастической аппроксимации.
Метод стохастической аппроксимации гарантирует отыскание точного положения экстремума функции ка чества в обстановке помех при N оо. Однако при реше нии практических задач такой необходимости пет. Реаль ные задачи всегда решаются с конечной точностью — нужно попасть в заданный район цели. Это заставляет модифицировать метод, изменяя характер зависимостей
O .N = f (N) и gN = ф (N).
Методы случайного поиска отличаются от регулярных (детерминированных) методов оптимизации намеренпым введением элемента случайности. Это означает, что в од ной и той же обстановке решение о направлении рабочего шага, принятое по методу случайного поиска, будет раз ным. Однако подобное «случайное» поведение является не только целесообразным, но в большом числе случаев и более эффективным, чем регулярное поведение.
Метод случайного поиска является прямым развитием известного метода проб и ошибок, когда решение ищется случайно, и при удаче принимается, а при неудаче отвер гается с тем, чтобы немедленно снова обратиться к слу чайности как к источнику возможностей. Такое «случай ное» поведение разумно опирается на уверенность, что случайность содержит в себе все возможности, в том числе и искомое решение во всех его вариантах.
Метод проб и ошибок является универсальным методом решения задач при недостаточной априорной информации об объекте. Он моделирует случайный поиск, имеющий место в природе, которую по праву можно считать изобре тателем случайного поиска.
Одним из проявлений эффективного случайного поиска в природе являются законы эволюции, открытые Ч. Дарвиным,— естественный и искусственный отбор. Здесь элемент случайности проявляется в виде мутаций, которые имеют случайный характер. Эти мутации могут либо улуч шить, либо ухудшить приспособительные свойства особи. В первом случае эта особь имеет больше шансов на выжи вание и, следовательно, на закрепление полученной мута ции в потомстве, чем во втором. Так, случайные мутации с последующим отбором (искусственным или естественным) являются могучим фактором прогресса в живой природе. А это не что иное, как случайный поиск.
параметров. Положительная реакция R+ следует за вы полнением в объекте цели управления, т. е. при устойчи вой реакции гомеостата. Она сохраняет в объекте те па раметры, которые привели к достижению цели. Алгоритм такого поведения удобно записать так:
при R ,
(17.1.7)
при R
Как легко заметить, такой алгоритм работы системы во обще и гомеостата в частности имеет целесообразное пове дение, направленное на поиск и сохранение в системе стабильного состояния, которое обеспечивает положи тельная реакция 7?+. Этот алгоритм естественно назвать алгоритмом с «наказанием» случайностью, так как слу чайное воздействие S вводится как реакция на неудачу в процессе управления.
Таким образом, смысл и содержание рассмотренного алгоритма случайного поиска заключается в том, чтобы случайно перебирать параметры системы до тех пор, пока не будут найдены такие, которые обеспечивают выполнение заранее сформулированных условий. В случае гомеостата таким условием является отыскание устойчивого состояния системы. Очевидно, что такой способ поведения представ ляется наиболее целесообразным в том случае, когда у управляющего устройства нет никаких сведений о струк туре объекта, т. е. он представляет собой «черный ящик».
Однако для работы этого алгоритма необходимо фор мально определить, что считать устойчивой и неустойчи вой работой гомеостата. Известно, что система однородных дифференциальных уравнений вида (17.1.1) имеет един ственное устойчивое решение хг — хг = х3 = ж4 = 0. Поэтому в основу критерия устойчивости можно положить
величину отклонения |
от |
устойчивого состояния |
|
|||
|
|
|
|
4 |
|
(17.1.8) |
|
|
|
|
|
|
|
Теперь, задав |
порог |
Ô |
0, |
можно |
при Q < ô |
систе |
му считать |
устойчивой, |
а |
при Q^>b — неустойчивой |
|||
(см. рис. 17.1.2, где заштрихована |
устойчивая |
в этом |
||||
смысле зона). |
|
|
|
|
|
|
Заметим, что такое определение устойчивости условно, |
||||||
так как при Q |
Ôсистема может быть уже неустойчивой, |
а при Q |
Ô может быть устойчивой (см. рис. 17.1.2). |
Однако эти |
случаи можно исключить, если управле |
ние сделать не мгновенным, а инерционным, т. е. реагиро вать на состояние системы не мгновенно, а через некоторое время наблюдения. За это время переходные процессы в системе затухнут и указанный критерий будет объек
тивно отражать состояние |
системы. |
Сформулированный алгоритм работы гомеостата можно |
|
записать в виде |
при <)(X )>ô, |
[ S |
|
"+1" 1 4 |
(17.1.9) |
при Q (X) < Ô. |
Естественно теперь задать вопрос: всегда ли можно найти параметры, при которых гомеостат окажется устой
чивым, т. е. возможно ли |
|
х2 |
||
случайным перебором пара |
|
//////у 7 , |
||
метров достигнуть |
устойчи |
'/////> |
||
вости всегда и наверняка? |
1 |
6 9 |
||
Для ответа на этот вопрос |
||||
разобьем множество всех воз |
. |
|||
можных реализаций парамет |
|
|||
ров гомеостата на |
два под |
% |
||
множества {4°} и {Л*}, в |
//717 7 7 7 // 7 7 7 7 7 7 // |
|||
первое из которых объедине |
||||
нызначения параметров, при |
|
|
||
водящие к неустойчивости, а |
Рис. 17.1.2. Пространство пе |
|||
во второе — вызывающие по |
||||
ременных гомеостата. |
ложительную реакцию, т. е.
обеспечивающие устойчивость гомеостата. Решение за дачи заключается, таким образом, в случайном отыскании хотя бы одного элемента второго множества за конечное число шагов поиска (под шагом поиска здесь подразуме ваются однократный случайный выбор параметров гомео стата и определение, к какому классу они относятся, т. е. проверка устойчивости). Ясно, что для этого необходимо, чтобы оба подмножества были примерно одинаковы. Это означает, что при случайном переборе всех возможных параметров «представители» подмножества {Л*} должны встречаться не слишком редко. Тогда при случайном пе реборе элементов множества всех возможных параметров
вероятность выбора хотя бы одного |
из элементов |
это |
го подмножества будет конечна. |
Следовательно, |
по |
вероятности процесс поиска закончится в конечное время и гомеостат обязательно придет в устойчивое состояние.
Представим работу гомеостата как функционирование некоторого стохастического автомата, действующего в слу чайной среде. С точки зрения управления гомеостат следует «расслоить» на среду и управляющее устройство УУ (рис. 17.1.3). Под средой здесь подразумевается динами ческая система (17.1.2), а управляющее устройство рабо тает в соответствии с алгоритмом случайного поиска (17.1.8). Динамическую систему следует привести в устой
|
чивое состояние X*, незави- |
||
|
X* симо от действия случайного |
||
С р е д а |
фактора Е. |
|
|
А |
Алгоритм случайного по- |
||
иска (17.1.9), |
реализуемый |
||
Q |
|||
УУ |
управляющим |
устройством |
|
|
гомеостата, является стохас |
||
Рис. 17.1.3. Представление го |
тическим автоматом, выход |
||
меостата в виде автомата, дей |
которого А изменяется в за |
||
ствующего в случайной среде. |
висимости от состояния вхо- |
да Q. Стохастическая матрица, характеризующая функцио
нирование этого автомата в случайной среде, |
имеет вид |
|||
|
R- |
1 - P |
Р |
(17.1.10) |
|
R+ |
О |
1 |
|
|
|
|||
где |
Р — вероятность отыскания |
устойчивого решения, |
||
удовлетворяющего поставленным целям |
управления |
|||
(Q ^ |
Ô). Эффективность |
функционирования |
гомеостата, |
очевидно, существенно зависит от величины Р. Чем боль ше Р, тем быстрее находится решение и тем эффективнее работает гомеостат.
Стохастический характер поведения гомеостата, как видно, определяется двумя факторами: оператором слу чайного шага S и неопределенностью среды, которая зависит от неизвестного случайного фактора ситуации Е.
Граф алгоритма работы гомеостата показан на рис. 17.1.4. Здесь кружками обозначены события — поло жительная и отрицательная реакции, а стрелками — условные переходы между ними. В скобках записаны усло вия этих переходов. Пунктирная стрелка показывает пере ход, не предусмотренный алгоритмом и соответствующий
потере устойчивости гомеостата за счет случайного воз действия Е.
Отметим, в заключение, некоторые характерные осо бенности алгоритма управления гомеостатом/: В этом управлении имеются два резко противоположных режима работы поиска. В первом, «наказуемом», системе предла гаются различные случайные варианты управления. Этот процесс продолжается до тех пор, пока не будет найдено удовлетворительное решение ((? ^ Ô), после чего включа ется второй режим, когда в виде «поощрения» система сохраняет найденные в первом режиме параметры.
Щ > 9 )
Рис. 17.1.4. Граф алгоритма гомеостата (линейная тактика).
Будем такой способ поведения называть линейным, а тактику такого поиска — линейной тактикой.
Как видно, линейная тактика отличается сохранением того управления, которое привело к успеху. Эта тактика имеет несколько «педантичный» характер, но вполне ра зумна и обоснованна при управлении не слишком слож ными системами (под сложностью в данном случае подра зумевается не число параметров, а структура задачи). В большинстве случаев линейная тактика управления приводит к эффективным результатам.
§ 17.2. Случайный поиск с линейной тактикой
Линейная тактика, как сказано выше, отличается тем, что действие, которое привело к удаче, сохраняется и далее. Применим эту тактику для оптимизации объекта.
Одним из алгоритмов случайного поиска, использую щего линейную тактику, является гомеостатический поиск построенный по алгоритму гомеостата (17.1.9)
Здесь определяется такой вектор оптимизируемых пара метров X*, который обеспечивает выполнение неравенства
Q (X *) < Ô, |
(17.2.2) |
|
где Ô — заданное число, |
S — случайный |
вектор, |
S = (?„ |
Ы , |
(17-2.3) |
распределенный равномерно в зоне допустимых парамет ров, т. е. S G S.
Гомеостатический поиск представляет собой случайное сканирование и его целесообразно применять только тогда, когда вероятность Р отыскания решения, удовлет воряющего неравенству (17.2.2), достаточно велика. Эта вероятность определяет среднее число шагов случайного поиска, необходимых для решения задачи:
ЛГср=-р-- |
(17.2.4) |
Как видно, при малых значениях вероятности Р среднее число шагов поиска велико.
Рассмотрим пример применения этого алгоритма — один из способов решения системы линейных алгебраиче ских уравнений:
П
/^1 |
===Cj |
(/ == |
•••» Гг), |
(17.2.5) |
i= l
где ац и cj (i, / = 1, . ., гг) — заданные величины, — неизвестные. Образуем функцию невязки
п |
п |
|
Q(X)= 2 |
( 2 а д - ^ ) - |
(17.2:6) |
3=1 i= 1
минимум которой равен нулю и, следовательно, соответствует решению задачи X*. Уравнение
Q (X) = Ô |
(17.2.7) |
определяет гиперэллипсоид в пространстве искомых пере менных {X}. Если теперь взять точки Xi (i = 1, . т\, равномерно распределенные внутри этого гиперэллип соида:
Я (Xi) < 8 |
(i = 1, |
m), |
(17.2.8) |
то их среднее определяет центр гиперэллипсоида и, сле довательно, является оценкой решения X*:
т
Я .* = |
~ S X,. |
(17.2.9) |
|
г= 1 |
|
Очевидно, что в пределе при т |
оо среднее (17.2.9) |
|
является точным решением |
|
|
X* = |
lira Т т. |
(17.2.10) |
|
771—>00 |
|
Задача, таким образом, сводится к отысканию случайных точек Xi, удовлетворяющих неравенству (17.2.8). Это проще всего сделать, используя случайный поиск, рас смотренный выше. Успех этого поиска в значительной мере определяется величиной вероятности Р. Если она мала, то целесообразность применения этого алгоритма
следует |
ставить под сомнение. |
При |
отыскании минимума заданной функции Q = |
= Q (X) |
для целей экстремального управления приме |
нение этого алгоритма явно не оправдано, так как связано с большими временными затратами. Причина этого заклю чается в том, что рассмотренный гомеостатический алго ритм случайного поиска решает вопрос об отыскании ре шения в принципе. Он лишь гарантирует конечность вре мени отыскания решения. Вопросы же быстродействия не решаются этим алгоритмом, так как он предназначен для управления объектами самого широкого класса с един ственным ограничением, связанным с конечностью вероят ности отыскания решения.
Однако в задачах экстремального управления часто имеются дополнительные сведения об объекте, напримёр о характере поведения его показателя качества при”раз личных управлениях. Эта информация дает возможность применить новые алгоритмы управления, уже решающие вопросы быстродействия с учетом имеющихся дополни тельных сведений об объекте. Такие дополнительные све дения об объекте оптимизации, прежде всего, несет его функция качества Q (X), которую требуется минимизи ровать. Нетрудно заметить, что сведения о гладкости ги перповерхности Q — Q (X) могут помочь в значительной степени убыстрить процесс оптимизации, так как при этом