Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТОАУ.docx
Скачиваний:
50
Добавлен:
21.12.2018
Размер:
1.32 Mб
Скачать

Неавтономный объект с закрепленными концами траектории и нефиксированным временем управления

Чтобы управление было оптимальным для , необходимо существование такой ненулевой непрерывной вектор-функции , соответствующей функциям , и сопряженной системе (1.89), чтобы при любом : 1) функция , определяемая соотношением (1.85), достигала максимума по ; 2) выполнялось условие , а также в конечный момент времени было справедливо .

Последнее условие, утверждающее, что максимальное значение гамильтониана, соответствующее оптимальным управлению и функциям , в конечный момент времени должно равняться нулю, является своеобразным условием для отыскания неизвестного момента . Текущее максимальное значение гамильтониана на оптимальной траектории изменяется по закону

Неавтономный объект со свободным правым концом траектории и нефиксированным временем управления

Чтобы управление было оптимальным для , необходимо существование такой ненулевой непрерывной вектор-функции , соответствующей функциям и сопряженной системе (1.89), чтобы 1) при любом функция , определяемая соотношением (1.85), достигала максимума по 2) в конечный момент времени выполнялись условия

Последнее условие служит для отыскания неизвестного момента .

Оптимальное управление автономными объектами

Уравнения объекта и критерии качества не содержат в явном виде аргумент . Формулировка необходимых условий оптимальности полностью совпадает с рассмотренными случаями управления неавтономными объектами. Отличие проявляется только в поведении максимального значения гамильтониана на оптимальной траектории при нефиксированном времени управления. В задачах управления автономными объектами наибольшее значение гамильтониана в любой момент времени постоянно и равно нулю. Необходимость введения переменных в этих задачах отпадает, что приводит к понижению порядков уравнений (1.75) и (1.90).

Принцип максимума с использованием условий трансверсальности обобщается на случаи подвижных концов траектории. Результаты соответствующих обобщений систематизированы, например, в [3, 26, 48].

Остановимся на отличиях формулировок принципа мак­симума в зависимости от особенностей задачи оптимального управления. Основное содержание принципа максимума сводится к условию (1.86), утверждающему, что оптимальное управление в любой момент времени должно доставлять наибольшее значение гамильтониану . Из этого условия принципиально можно найти оптимальное управление как функцию пока неизвестных переменных . Если оптимальное управление подставить в (1.75), (1.89) или (1.90), то певучим систему из уравнений с таким же количеством неизвестных . Для решения системы формально нужно иметь условий. Имеем условий в начальной точке , а остальные условий формируются различным образом в зависимости от конкретных особенностей задачи:

а) если правый конец траектории свободен, то получаем условий в виде величины ; если при этом фиксировано, то всегда будем иметь условий, необходимых для решения задачи; если же неизвестно, то используем дополнительное ограничение на максималь­ное значение гамильтониана, что снова устанавливает со­ответствие между количеством неизвестных и граничных условий;

б) если правый конец траектории закреплен, то вместо значений используем заданных условий в виде . Так как функция Гамильтона (1.85) зависит от вектора линейно, то этот вектор может быть определен с точностью до постоянного сомножителя, который не повлияет на оптимальное управление . Поэтому в соответствии с ограничением можно принять , что дает еще одно условие и делает равным число неизвестных и имеющихся условий, используемых при отыскании постоянных интегрирования. Если же неизвестно, то дополнительно учитываем ограничение на максимальное значение гамильтониана в конечной точке.

Таким образом, при использовании принципа максимума приходим к краевой задаче для систем дифференциальных уравнений. Универсального рецепта решения этой задачи в настоящее время нет. В каждой задаче проводится самостоятельное исследование. Полезно отметить, что существует связь принципа максимума с вариационными методами и методом динамического программирования, позволяющая при определенных условиях установить су­щество каждого из этих методов на основании другого метода.

Рассмотрим применимость принципа максимума на ряде задач, допускающих аналитическое решение.

Пример 1.12. С использованием принципа максимума решим задачу 1.9, ранее исследованную в терминах вариационного исчисления. В соответствии с основными принципами формализма метода вводим вектор , задаваемый уравнениями . Переменная (1.70) не используется, так как время в явном виде не участвует в формировании уравнений объекта и критерия качества. Далее, на основании (1.85) составляем гамильтониан и в соответствии с принципом максимума оптимальное управление ищем из условия его максимума. Так как на ограничений нет, то соответствующее условие принимает вид и приводит к результату . На основании (1.90) составляем систему сопряженных уравнений: из которой следует . Так как решается задача с фиксированным временем управления и закрепленными концами траектории, принимаем . Коэффициенты должны обеспечить прохождение траектории через заданные граничные точки. С этой целью оптимальное управление подставляем в уравнения объекта, которые после интегрирования дают ; ,теперь постоянные легко найти из четырех заданных граничных условий. Решение задачи, таким образом, полностью совпадает с результатами примера 1.9.

Пример 1.13. Рассмотрим одномерный объект с уравнением при заданном начальном состоянии и при отсутствии ограничений на . Критерий качества фиксировано, подлежит минимизации. В данном случае имеем задачу со свободным правым концом траектории. Модифицированное состояние описывается уравнениями . Из общего определения (1.85) следует гамильтониан . Максимизирующее гамильтониан оптимальное управление оказывается равным . Система сопряженных уравнений (1.90) принимает вид . Так как правый конец траектории свободный, выполняется условие . Для нахождения следует совместно решить сопряженное уравнение и уравнение объекта, т. е. систему , при условиях . Разрешив первое уравнение относительно и подставив его во второе, приходим к однородному уравнению , которое имеет решение , где — — корень характеристического уравнения . Для определения постоянных интегрирования используем граничное условие и при — сопряженное уравнение .

В результате получаем систему уравнений , из которой находим . Оптимальное управление принимает окончательный вид .

Пример 1.14. Рассмотрим особенности применения принципа максимума в задаче с ограничением на управление. Пусть ОУ описывается уравнением . Требуется найти управление, при котором величина в известный момент окажется наибольшей. Очевидно, что таким управлением должно быть . Докажем это предположение с помощью прин­ципа максимума. Прежде всего, введем минимизируемый критерий качества и составим систему уравнений , в соответствии с которой формируем . Находим управление, максимизирующее . Так как в входит линейно, то при ограничении достигает наибольшего значения, если максимально по модулю, а знак таков, что второе слагаемое в составе максимально. Это условие обеспечивается, если , где при и при . В соответствии с (1.90) составляем систему сопряженных уравнений . Из первого уравнения следует .

Задавшись произвольным начальным условием решаем второе уравнение: . Так как рассматриваемая задача характеризуется свободным правым концом и фиксированным , то выполняется граничное условие . Следовательно, , а начальная величина находится из условия . Поэтому , и оптимальное управление при­нимает окончательный, вид , что совпадает с нашим начальным предположением.

Если предположить, что величина не задана, необходимо использовать дополнительное условие , в соответствии с которым вычисляют гамильтониан на оптимальной траектории в какой-либо момент времени. Проще всего это сделать для . Имеем . Подставив эти значения в , находим , откуда . Следовательно, если не задано, величина достигает наибольшего значения при . Этот результат очевиден: если на рассматриваемый объект подать единичное управление, то выходной процесс начинает возрастать по экспоненциальному закону. Максимальное значение достигается на бесконечности.