
- •Раздел 3
- •Глава 12. Задачи оптимального управления и методы их приближенного решения
- •§1. Постановка задачи оптимального управления
- •§2. Принцип максимума л. С. Понтрягина
- •§3. Метод приближенного решения задачи оптимального управления, использующий п-систему
- •§4. Приближенное решение задачи оптимального управления методом вариаций в фазовом пространстве. Метод локальных вариаций
- •§5. Приближенное решение задачи оптимального управления методом вариаций в пространстве управлений
- •§6. Метод динамического программирования Беллмана
- •§7. Приближенное решение задач оптимального управления методом динамического программирования Беллмана
- •Этап 2.
- •Этап 1.
- •Этап 2.
- •§8. Приближенное решение задач оптимального управления путем сведения к задаче нелинейного программирования
Этап 2.
Шаг 1. Находим управление
и состояние
.
Шаг 2. Находим управление
и состояние
.
…………………..
Шаг N. Находим управление
и состояние
=
●
Заметим,
что при приближенном решении задач
оптимального управления методом
динамического программирования остается
открытым вопрос о сходимости решения
к решению
исходной непрерывной задачи оптимального
управления (1), (2).
Пример 1. Решим методом динамического программирования Беллмана задачу оптимального управления
, (8)
, (9)
где
- символ целой части числа (т.е. множество
есть множество целых числе от 0 до 4).
Подобно (3), (4) заменим ОДУ (11) его конечно-разностным аналогом
,
(10)
а функционал (9) - его приближенным значением, вычисленным по формуле прямоугольников
. (11)
Положим,
что
.
Обратим
внимание на следующее обстоятельство:
из (8) и условия
следует, что фазовая переменная
может принимать только целочисленные
значения в интервале
.
Этап 1.
Шаг 1
. Из условия (6) находим условно оптимальное управление
и функцию Беллмана
=
. Из выражения (8) следует, что
. Поэтому
и
. Сведем результаты вычисления значений функции
в таблицу 1. Прочерки в таблице соответствуют не допустимым управлениям; значения управления и функции Беллмана, выделенные жирным, соответствует оптимальной траектории.
Таблица
1 - Значения
функции Беллмана
-
0
1
2
3
4
4
4
3
2
1
0
16
9
4
1
0
Шаг 2
.Используя результаты предыдущего шага, из условия (7) находим условно оптимальное управление
и функцию Беллмана
=
- таблица 2.
Рассмотрим,
для примера, схему получения значений
,
,
соответствующих переходу системы из
состояния
в состояние
.
Из состояния
в состояние
система переходит под действием
управления
и этому переходу соответствует
значение функции Беллмана
,
равное 16 (таблица 1). Переход системы
из состояния
в состояние
может быть выполнен только под действием
управления
.
Поэтому
=
=16.
Таблица
2 - Значения
функции Беллмана
-
0
1
2
3
4
0
0
-
-
-
-
16
1
1
0
-
-
-
10
9
2
2
1
0
-
-
8
5
4
3
3
2
1
0
-
10
5
2
1
4
4
3
2
1
0
16
9
4
1
0
Шаг
3
.
Используя результаты предыдущего шага,
из условия (7) находим условно оптимальное
управление
и функцию Беллмана
=
- таблица 3. Прочерки в таблице соответствуют
не допустимым управлениям; значения
управления и функции Беллмана, выделенные
жирным, соответствует оптимальной
траектории.
Таблица
3 - Значения
функции Беллмана
|
|
|
0 | ||
0 |
|
0 |
|
16 | |
1 |
|
1 |
|
10 | |
2 |
|
2 |
|
8 | |
3 |
|
3 |
|
10 | |
4 |
|
4 |
|
16 |
Рассмотрим,
для примера, схему получения значений
,
,
соответствующих переходу системы из
состояния
в состояние
.
Из состояния
система может перейти оптимально в
состояние
или в состояние
Первому переходу соответствует
оптимальное управление
,
второму переходу – оптимальное управление
.
Указанным переходам соответствует
значение функции Беллмана
,
равное 16 (таблица 1). Переход системы из
состояния
в состояние
может быть выполнен только под действием
управления
.
Поэтому
=
=16.