Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
RK6_Методы_Оптимизации / Все вместе / Оптимизация Глава 12.doc
Скачиваний:
425
Добавлен:
10.02.2015
Размер:
5.99 Mб
Скачать

§2. Принцип максимума л. С. Понтрягина

Для простоты записи положим, что и рассмотрим стационарную динамическую систему без фазовых ограничений

(1)

Требуется найти управление , которое переводит стационарную динамическую систему (1) из состоянияХ0 в состояние ХT и минимизирует функционал

(2)

Введем в рассмотрение константу и вспомогательнуювектор-функцию, являющуюся решением системы ОДУ

(3)

или, в векторной форме, - системы

где

- (4)

гамильтониан динамической системы (1). Часто более удобно систему ОДУ (3) записывать в виде

, (5)

где есть-матрица частных производных вектор-функциипо, т.е.

.

Система ОДУ (3) или, что то же самое, (5) называется сопряженной системой ОДУ.

Теорема 1 (принцип максимума Л.С. Понтрягина). Пусть , – допустимое управление, переводящее систему (1) из точки Х0 в точку ХT, а – соответствующая фазовая траектория. Для оптимальности (в смысле минимума функционала (2)) процессанеобходимо существование такой константы и такого решениясистемы ОДУ (3), что вектор- функцияне тривиальна и для любого момента времени выполняется условие максимума

, (6)

где гамильтониан системы определяется выражением (4)●

Не тривиальность вектор-функции означает, что среди величинимеется хотя бы одна тождественно не равная нулю.

Отметим, что начальные условия для системы ОДУ (3) не заданы, т.е. можно получить только общее решение этой системы.

Поскольку принцип максимума определяет лишь необходимое условие оптимальности, из того факта, что некоторая траектория удовлетворяет ему, не следует, что она оптимальна. Т.е. принцип максимума дает траектории лишь «подозрительные» на оптимальность. Для определения из их числа оптимальной траектории необходима дополнительная проверка.

Вслед за Федоренко Р.П. назовем систему уравнений (1) - (4) П-системой.

Рассмотрим теперь принцип максимума Л.С. Понтрягина для задачи оптимального быстродействия. Напомним, что в этом случае критерий оптимальности имеет вид

. (7)

Гамильтониан системы (1) в данном случае определяется выражением

. (8)

Теорема 2 (принцип максимума Л.С. Понтрягина для задачи оптимального быстродействия). Пусть , – допустимое управление, переводящее систему (1) из точки Х0 в точку ХT, а – соответствующая фазовая траектория. Для оптимальности (в смысле минимума функционала (7)) процессанеобходимо существование такого решениясистемы ОДУ (3), что вектор- функцияне тривиальна и для любого момента времени и выполняется условие максимума

(9)

где гамильтониан системы определяется выражением (8)●

Известно множество обобщений принципа максимума Л.С. Понтрягина. Рассмотрим некоторые из них.

1. Задача с подвижными концами. Здесь векторы не фиксированы, а заданы лишь некоторые гладкие многообразия(гладкие поверхности, расположенные в пространствеХ, размерность которых меньше n) такие, что .

2. Дополнительные ограничения на вектор управления. Кроме требования минимизации критерия оптимальностизаданы ограничения вида

,

где – некоторые функционалы надU(t).

3. Обобщение для нестационарных динамических систем.

4. Обобщение для динамических систем с параметрами:

где – неизвестный вектор параметров (констант). Требуется выбрать такой допустимый векторW* и такое управление , чтобы перевести систему из состоянияХ0 в состояние ХT и минимизировать функционал J0

Пример 1. Рассмотрим материальную точку массой m=1, которая свободно без трения движется по горизонтальной прямой. Пусть эта точка снабжена двигателем, развивающим силу тяги такую, что.

Введем обозначения

.

Таким образом, для рассматриваемой динамической системы вектор фазовых переменных и имеет место следующее формальное описание системы (см. рисунок 1):

(10)

Рисунок 1 - К примеру 1

Поставим задачу оптимального быстродействия – задачу о быстрейшем попадании рассматриваемой точки в начало координат (0,0) из заданного начального состояния . Другими словами, поставим задачу перевода за кратчайшее время материальной точки, имеющей начальное положениеи начальную скорость, в начало координат с нулевой скоростью (чтобы точка перешла в начало координат и остановилась там).

Гамильтониан системы (10) для задачи оптимального быстродействия имеет вид

а система ОДУ для вспомогательной вектор- функции - вид

(11)

Легко получить явное общее решение системы ОДУ (11)

где - произвольные постоянные.

Уравнение (9) имеет в данном случае вид

(12)

Поскольку - линейная функция, из (12) следует, что оптимальное управлениедолжно удовлетворять условию

,

т.е.

Таким образом, оптимальное управление ,является кусочно-постоянной функцией, принимающей значения ±1 и имеющей не более двух интервалов постоянства (т.к. линейная функция не более одного раза меняет знак на отрезке) –рисунок 2.

Рисунок 2 – К определению оптимального управления

Приведем графическую иллюстрацию полученных результатов. На отрезке времени, на котором , из (10) последовательно имеем

Таким образом, фазовые траектории, для которых , представляют собой семейство парабол, соответствующих разным значениям константыc - рисунок 3а. По этим параболам фазовые точки движутся снизу вверх (поскольку ).

Аналогично, управлению соответствует семейство парабол, по которым фазовые точки движутся сверху вниз (т.к.) – рисунок 3б.

Рисунок 3 - Фазовые траектории системы (10): а) – при ; б) – при

Поскольку оптимальное управление является кусочно-постоянной функцией, принимающей значения ±1 и имеющей не более двух интервалов постоянства, возможны только варианты оптимальных фазовых траекторий системы, представленные на рисунок 4.

Рисунок 4 - Варианты фазовых траекторий системы (9): а) – сначала , а затем; б) – сначала, а затем

Таким образом, оптимальные фазовые траектории состоят из двух кусков парабол, примыкающих друг к другу. Причем второй из этих кусков лежит на той из парабол, которая проходит через начало координат.

Для произвольных начальных условий имеем следующую картину, представленную на рисунок 5.

Рисунок 5 - Вид оптимальных фазовых траекторий системы (10)

На рисунке 5 дуга ОА имеет уравнение , а дугаВО – уравнение .

Итак, согласно принципу максимума Л.С. Понтрягина оптимальные (по быстродействию) фазовые траектории системы (10) могут быть только вида, приведенного на рисунке 5●

Входные термины:

  • задача оптимального управления;

  • гамильтониан динамической системы;

  • сопряженная система ОДУ;

  • принцип максимума Л.С.Понтрягина;

  • П-система;

  • метод касательных решения, метод Ньютона.

Выходные термины:

  • П-процедура;