- •1.1.2. Условия лежандра
- •1.1.5. Функционалы со многими неизвестными
- •1.1.9. Задачи нл условный экстремум
- •1.1.10. О решении задач оптимального управления вариационными методами
- •1.2. Метод динамического программирования
- •1.2.1. Принцип оптимальности
- •1.2.2. Одномерная дискретная задача и вычислительные аспекты метода
- •1.2.3. Метод динамического программирования в непрерывной задаче. Уравнение беллмана
- •1.3. Принцип максимума понтрягина
- •1.3.1. Игольчатая вариация и условия оптимальности
- •1.3.2. Система сопряженных уравнений
- •1.3.3. Обобщения. Обсуждение результатов
- •Неавтономный объект с закрепленными концами траектории и фиксированным временем управления
- •Неавтономный объект с закрепленными концами траектории и нефиксированным временем управления
- •Неавтономный объект со свободным правым концом траектории и нефиксированным временем управления
- •Оптимальное управление автономными объектами
- •1.3.4. Вычислительные аспекты принципа максимума
1.3.4. Вычислительные аспекты принципа максимума
Рассмотренные примеры относятся к весьма узкому классу задач оптимизации, которые позволяют в аналитической форме получить решение. Подобные задачи являются скорее исключением, нежели правилом — большинство из них решается только численно на ЭВМ. Для повышения эффективности численных процедур поиска оптимальных решений разработаны определенные рекомендации, помогающие организовать рациональный процесс последовательного приближения к оптимальному решению. Рассмотрим одно из распространенных правил последовательного поиска оптимального управления (схема И. А. Крылова и Ф. JI. Черноусько). Для определенности будем ориентироваться на одномерную задачу с фиксированным временем управления и свободным правым концом траектории. Логика метода последовательных приближений основана на том, что выбирается некоторое допустимое управление и последовательно улучшается до тех пор, пока не окажется подходящих допустимых вариаций управления, уменьшающих критерий качества. Существо метода изложим в форме следующей последовательности операций:
-
В области допустимых управлений
задаются некоторым допустимым управлением
— диспетчерским. Для простоты можно
положить
если
— допустимое управление. -
Управление
подставляют в уравнение объекта
управления (1.75) и интегрируют последнее
при начальных условиях (1.76). Соответствующее
решение обозначим
. -
На процессах
вычисляют критерий качества
. -
Составляют систему сопряженных уравнений (1.90). Входящие в эти уравнения функции
заменяют на
,
затем сопряженную систему интегрируют
справа налево от
до
при краевых условиях (1.81) (техника этой
операции частично отражена в примере
1.11). Соответствующее решение обозначим
символом
. -
В соответствии с (1.85) составляют выражение гамильтониана, в котором функции
заменяют на
результате получаем
.
Заметим, что управление
не заменяется диспетчерским управлением
. -
Так как в составе гамильтониана неизвестным является только управление
,
решается задача поиска такого допустимого
управления, на котором функция
достигает наибольшего значения. При
использовании ЭВМ все процессы можно
проквантовать по времени и для каждого
дискретного момента вычислить
максимизирующее управление в соответствии
с каким-либо алгоритмом поиска экстремума
функции. Соответствующие алгоритмы
излагаются в гл. 6. Обозначим полученное
в результате управление символом
. -
Управление
принимается за первое приближение к
оптимальному управлению, и относительно
него проводятся операции 2, 3. Результат
операции 2 обозначим символом
. -
Если окажется
,
то проводятся операции 4—6, вследствие
чего появляется второе приближение
оптимального управления

-
Если окажется
то первое приближение корректируется
путем перехода к функции
,
где
— эмпирически подбираемый коэффициент,
обеспечивающий неравенство
в составе которого
является результатом операции 2 при
управлении
.
Относительно
проводятся
последующие операции 4—6, вследствие
чего появляется второе приближение
. -
С управлением
проводятся все операции по схеме 2—9,
что приводит к третьему приближению
. -
Вычисления продолжают до тех пор, пока не будет достигнуто условие
,
при котором управления на двух соседних
циклах обращения к операциям 2-10 совпадают
и характеризуются одним и тем же
значением критерия качества. Это
управление принимается за окончательное
решение задачи
.
