- •Раздел 3
- •Глава 12. Задачи оптимального управления и методы их приближенного решения
- •§1. Постановка задачи оптимального управления
- •§2. Принцип максимума л. С. Понтрягина
- •§3. Метод приближенного решения задачи оптимального управления, использующий п-систему
- •§4. Приближенное решение задачи оптимального управления методом вариаций в фазовом пространстве. Метод локальных вариаций
- •§5. Приближенное решение задачи оптимального управления методом вариаций в пространстве управлений
- •§6. Метод динамического программирования Беллмана
- •§7. Приближенное решение задач оптимального управления методом динамического программирования Беллмана
- •Этап 2.
- •Этап 1.
- •Этап 2.
- •§8. Приближенное решение задач оптимального управления путем сведения к задаче нелинейного программирования
Этап 2.
Шаг 4. Из таблицы 3 следует, что существует два равноценных (приводящих к значению функции Беллмана, равному 16) оптимальных управления
.
По формуле
находим соответствующие значения
переменной состояния
:
;
.
Шаг 5. Из таблицы 2 следует, что для
существует два равноценных (приводящих
к значению функции Беллмана, равному
16) управления
.
Аналогично, из таблицы 2 следует, что
для
существует одно оптимальное управление
.
По формуле
находим соответствующие значения
переменной состояния
:
;
;
.
Шаг 6. Из таблицы 1 следует, что для
существует одно оптимальное управление
.
Аналогично, из таблицы 2 следует, что
для
существует одно оптимальное управление
.
По формуле
находим соответствующие значения
переменной состояния
:
;
.
Полученные
оптимальные управления
и соответствующие оптимальные фазовые
траектории
иллюстрирует рисунок 3●

Рисунок
3 - К примеру
1. Оптимальные управления
и соответствующие оптимальные фазовые
траектории![]()
Входные термины:
задача оптимального управления;
задача нелинейного программирования;
задача многомерной условной оптимизации;
критерий оптимальности управления;
вектор фазовых координат динамической системы;
фазовая траектория динамической системы;
вектор варьируемых параметров;
критерий оптимальности;
множество допустимых значений вектора варьируемых параметров.
Выходные термины:
§8. Приближенное решение задач оптимального управления путем сведения к задаче нелинейного программирования
Рассмотрим задачу оптимального управления
. (1)
(2)
Обратим
внимание на то, что так же, как в предыдущем
параграфе, для обозначения
фазового вектора использована маленькая
букваx,
а для обозначения
вектора управления – маленькая букваu.
Метод решения задачи оптимального управления (1), (2) путем сведения этой задачи к задаче нелинейного программирования рассматривался в главе 1 (на одном частном примере). Изложим общую схему этого метода.
Покроем
интервал
равномерной или неравномерной сеткой
с шагом
(рисунок 1).

Рисунок
1 - Временная
сетка
на интервале
![]()
Систему ОДУ (1) заменим ее конечно-разностным аналогом
, (3)
а функционал (2) заменим его приближенным значением, вычисленным по формуле прямоугольников
, (4)
где
есть
-матрица.
Дискретная задача оптимального управления (3), (4) представляет собой задачу нелинейного программирования
(5)
где,
в отличие от рассматриваемой ранее
постановки задачи оптимизации,
используется не вектор варьируемых
параметров, а матрица
варьируемых параметров. Очевидно, что
легко перейти от
матрицы варьируемых параметровU
к привычному для нас
вектору варьируемых параметров
.
Пусть
тем или иным способом заданы значения
элементов
матрицы
.
Тогда для вычисления соответствующего
значения критерия оптимальности
необходимо выполнить следующие действия:
при управлениях
по формуле (3) последовательно вычисляем
значения компонент вектора
для
;с найденными векторами
,
и управлениями
по формуле (5) вычисляем значение критерия
оптимальности
.
Задача нелинейного программирования (5) может быть решена рассмотренными ранее методами условной оптимизации. Очевидно, что можно использовать более точные, чем (3), (4) аппроксимации уравнения (1) и функционала (2).
Повторим упоминавшийся выше пример из главы 1, используя введенные выше обозначения.
Пример
1. Рассмотрим
двумерную
задачу оптимального управления
с одномерным
вектором управления
(6)
,
![]()
![]()
, (7)
где
- заданные скалярные константы, а
- заданная скалярная функция.
Систему ОДУ (6) заменим ее конечно-разностным аналогом

где
,а функционал
(7) заменим его приближенным значением,
вычисленным по формуле прямоугольников
.
где
есть
-вектор
(поскольку
- скалярная функция).
Таким образом, задача оптимального управления (6), (7) сведена к N-мерной задаче условной оптимизации
,
где множество допустимых значений вектора варьируемых параметров
![]()
![]()
●
Изложенный
метод создает впечатление тривиальности
решения задач оптимального управления.
Действительно, есть теоремы о том, что
решение дискретной задачи (3), (4) сколь
угодно точно (при
)
аппроксимирует решение исходной задачи
(1), (2). Есть теоремы о сходимости методов
оптимизации, с помощью которых может
быть найден минимум (4). Однако всегда
остаются открытыми вопросы: можно ли
данноеN
считать достаточно большим?; можно ли
ограничиться данным числом итераций
при решении задачи (4)?. Т.е. необходим
тщательный содержательный контроль
результатов. Иначе легко получить
решения, сколь угодно далекие от
действительно оптимальных решений. В
целом, данный метод (впрочем, как и любой
другой) может быть рекомендован только
в комбинации с другими методами.
