- •Раздел 3
- •Глава 12. Задачи оптимального управления и методы их приближенного решения
- •§1. Постановка задачи оптимального управления
- •§2. Принцип максимума л. С. Понтрягина
- •§3. Метод приближенного решения задачи оптимального управления, использующий п-систему
- •§4. Приближенное решение задачи оптимального управления методом вариаций в фазовом пространстве. Метод локальных вариаций
- •§5. Приближенное решение задачи оптимального управления методом вариаций в пространстве управлений
- •§6. Метод динамического программирования Беллмана
- •§7. Приближенное решение задач оптимального управления методом динамического программирования Беллмана
- •Этап 2.
- •Этап 1.
- •Этап 2.
- •§8. Приближенное решение задач оптимального управления путем сведения к задаче нелинейного программирования
§4. Приближенное решение задачи оптимального управления методом вариаций в фазовом пространстве. Метод локальных вариаций
Метод вариаций в фазовом пространстве разработан под руководством Н.Н. Моисеева в ВЦ АН СССР. Имеется несколько вариантов метода. Наиболее развитым является метод локальных вариаций Ф.Л. Черноусько.
Рассмотрим задачу оптимального управления
(1)
(2)
Обратим внимание на то, что в постановке задачи присутствуют кроме ограничений на вектор управления также ограничения на вектор фазовых координат.
Пусть
- некоторая траектория динамической
системы (1), удовлетворяющая краевым
условиям
и фазовым ограничениям
.
Покроем интервал времени
сеткой с несовпадающими узлами
и рассмотрим последовательность
точек
,
которую также будем называть траекторий
системы (1).
Элементарной
операцией называется
решение задачи (1), (2) для интервала
,
т.е. решение следующей задачи
(3)
(4)
Обозначим
«цену» элементарной операции
.
Т.е.
- это значение критерия качества
управления
приоптимальном
(в смысле минимума функционала (4))
переводе системы (1) из состояния
в состояние
.
В
связи с малостью интервала
решать задачу оптимального
управления (3), (4) не обязательно
очень точно. Это обстоятельство позволяет
во многих случаях достаточно просто
получить цену элементарной операции
.
Во
введенных обозначениях функционал (2)
на траектории
равен
. (5)
Локальной
вариацией траектории
(в фазовом пространстве) называется
траектория, отличающаяся от данной
траектории только значениемX
в точке
.
Обычно рассматриваются локальные
вариации, в которых точка
смещается только вдоль координатных
направлений (рисунок 1):
.
Здесь
- компонента вектора
с номером
,
-k-й
орт в n-мерном
пространстве,
- шаг по соответствующей компоненте
фазового вектора.

Рисунок 1 - К определению локальной вариации в фазовом пространстве (n=2)
Отметим,
что локальная вариация траектории
в точке
приводит к изменению в сумме (5) только
двух слагаемых -
и
.
Cхема метода локальных вариаций
Из каких либо соображений задаем начальное приближение к оптимальной траектории
,
удовлетворяющее краевым условиям
и ограничениям
.
Покрываем
интервал
сеткой с узлами
.
Счетчику числа
итераций r
присваиваем значение 0.Последовательно для
на интервале
выполняем
элементарную операцию и определяем ее
«цену»
.Для каждого
последовательно для каждого
выполняем следующие действия:
выполняем локальную вариацию
;если полученная в результате новая точка
является допустимой (т.е.
),
то переходим к следующему пункту; иначе
- переходим к п.3. 4;на интервалах
,
выполняем элементарные операции
и определяем их «цены»
,
;
если данная локальная вариация была
успешной, т.е.
+
<
+
,
то полагаем
=
,
=![]()
и переходим к следующему пункту;
выполняем локальную вариацию
;если полученная в результате новая точка
является допустимой (т.е.
),
то переходим к следующему пункту; иначе
- полагаем
переходим к п.3. 1.выполняем действия, указанные в п. 3. 3.
Проверяем выполнение условия окончания итераций (см. ниже). Если это условие выполнено, то в качестве приближения к оптимальной траектории
принимаем текущую траекторию
,
а в качестве приближения коптимальному
управлению
- управления, найденные при выполнении
элементарных операций, соответствующих
траектории
.
Иначе полагаем
и переходим к п. 2●
В качестве условия окончания итераций используется равенство нулю количества удачных локальных вариаций после данной итерации.
Действия,
указанные в пункте 3 приведенной схемы
метода локальных вариаций, будем называть
основным
циклом метода локальных вариаций. Легко
видеть, что временная сложность основного
цикла равна
.
В изложенном виде метод локальных вариаций обладает рядом серьезных недостатков. Назовем основные из этих недостатков:
существование тупиковых ситуаций - во множестве локальных вариаций не оказывается удачной не потому, что данная траектория оптимальна, а потому, что исследуются не все возможные вариации траектории, а только чрезвычайно узкое множество соседних с данной;
медленная сходимость;
трудность построения элементарной операции.
Указанные недостатки приводят к тому, что в изложенном виде метод локальных вариаций используется редко. В вычислительной практике используются различные модификации метода локальных вариаций - метод дробных шагов, метод бегущей волны, метод трубки и др.
Входные термины:
задача оптимального управления;
критерий качества управления;
задача линейного программирования.
Выходные термины:
невозмущенное управление;
функциональная производная в смысле Фреше;
полная окрестность невозмущенного управления.
