
- •1.1.2. Условия лежандра
- •1.1.5. Функционалы со многими неизвестными
- •1.1.9. Задачи нл условный экстремум
- •1.1.10. О решении задач оптимального управления вариационными методами
- •1.2. Метод динамического программирования
- •1.2.1. Принцип оптимальности
- •1.2.2. Одномерная дискретная задача и вычислительные аспекты метода
- •1.2.3. Метод динамического программирования в непрерывной задаче. Уравнение беллмана
- •1.3. Принцип максимума понтрягина
- •1.3.1. Игольчатая вариация и условия оптимальности
- •1.3.2. Система сопряженных уравнений
- •1.3.3. Обобщения. Обсуждение результатов
- •Неавтономный объект с закрепленными концами траектории и фиксированным временем управления
- •Неавтономный объект с закрепленными концами траектории и нефиксированным временем управления
- •Неавтономный объект со свободным правым концом траектории и нефиксированным временем управления
- •Оптимальное управление автономными объектами
- •1.3.4. Вычислительные аспекты принципа максимума
1.3.4. Вычислительные аспекты принципа максимума
Рассмотренные примеры относятся к весьма узкому классу задач оптимизации, которые позволяют в аналитической форме получить решение. Подобные задачи являются скорее исключением, нежели правилом — большинство из них решается только численно на ЭВМ. Для повышения эффективности численных процедур поиска оптимальных решений разработаны определенные рекомендации, помогающие организовать рациональный процесс последовательного приближения к оптимальному решению. Рассмотрим одно из распространенных правил последовательного поиска оптимального управления (схема И. А. Крылова и Ф. JI. Черноусько). Для определенности будем ориентироваться на одномерную задачу с фиксированным временем управления и свободным правым концом траектории. Логика метода последовательных приближений основана на том, что выбирается некоторое допустимое управление и последовательно улучшается до тех пор, пока не окажется подходящих допустимых вариаций управления, уменьшающих критерий качества. Существо метода изложим в форме следующей последовательности операций:
-
В области допустимых управлений
задаются некоторым допустимым управлением
— диспетчерским. Для простоты можно положить
если
— допустимое управление.
-
Управление
подставляют в уравнение объекта управления (1.75) и интегрируют последнее при начальных условиях (1.76). Соответствующее решение обозначим
.
-
На процессах
вычисляют критерий качества
.
-
Составляют систему сопряженных уравнений (1.90). Входящие в эти уравнения функции
заменяют на
, затем сопряженную систему интегрируют справа налево от
до
при краевых условиях (1.81) (техника этой операции частично отражена в примере 1.11). Соответствующее решение обозначим символом
.
-
В соответствии с (1.85) составляют выражение гамильтониана, в котором функции
заменяют на
результате получаем
. Заметим, что управление
не заменяется диспетчерским управлением
.
-
Так как в составе гамильтониана неизвестным является только управление
, решается задача поиска такого допустимого управления, на котором функция
достигает наибольшего значения. При использовании ЭВМ все процессы можно проквантовать по времени и для каждого дискретного момента вычислить максимизирующее управление в соответствии с каким-либо алгоритмом поиска экстремума функции. Соответствующие алгоритмы излагаются в гл. 6. Обозначим полученное в результате управление символом
.
-
Управление
принимается за первое приближение к оптимальному управлению, и относительно него проводятся операции 2, 3. Результат операции 2 обозначим символом
.
-
Если окажется
, то проводятся операции 4—6, вследствие чего появляется второе приближение оптимального управления
-
Если окажется
то первое приближение корректируется путем перехода к функции
, где
— эмпирически подбираемый коэффициент, обеспечивающий неравенство
в составе которого
является результатом операции 2 при управлении
. Относительно
проводятся последующие операции 4—6, вследствие чего появляется второе приближение
.
-
С управлением
проводятся все операции по схеме 2—9, что приводит к третьему приближению
.
-
Вычисления продолжают до тех пор, пока не будет достигнуто условие
, при котором управления на двух соседних циклах обращения к операциям 2-10 совпадают и характеризуются одним и тем же значением критерия качества. Это управление принимается за окончательное решение задачи
.