Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Глава 6.doc
Скачиваний:
2
Добавлен:
01.05.2025
Размер:
2.09 Mб
Скачать

6.3. Принцип максимума

Принцип максимума является развитием классического вариационного исчисления и разработан академиком Л. С. Понтрягиным совместно с его коллегами в 1956 г.

Рассмотрим главные соотношения данного принципа на основе решения задачи о быстродействии системы управления. Пусть модель движения объекта управления имеет вид

(6.18)

и критерий оптимизации равен

. (6.19)

Объект управления необходимо перевести из начального состояния х0 в фиксированное конечное xf. Предположим, что известна оптимальная траектория движения объекта (рис. 6.1) и оптимальный закон управления (рис. 6.2).

Рис. 6.1. Оптимальная траектория Рис. 6.2. Оптимальный закон

движения управления

Пусть при реализации оптимального закона управления в течение короткого времени  произошло импульсное отклонение от оптимальной траектории, начиная с момента   , а в момент  управление возвращается к старой траектории. Траектории, приведенные на рис. 6.1, 6.2, трансформируются (рис. 6.3, 6.4).

Рис. 6.3. Траектория движения Рис. 6.4. Закон управления системы

системы

Обозначим неоптимальную часть траектории движения объекта через , а неоптимальный уровень управления через .

Запишем траектории движения неоптимальной и оптимальной систем на интервале :

; (6.20)

. (6.21)

Найдем вариацию траектории системы относительно оптимальной траектории

(6.22)

Пусть  равна произведению положительного целого числа М на малое е. На интервале времени [, tf] движения неоптимальной и оптимальной систем запишем в виде

; (6.23)

.

Если разложить в ряд Тейлора правую часть уравнения и ограничиться линейными членами разложения, то получим

. (6.24)

В результате имеем зависимость для скорости изменения вариации траектории в виде

. (6.25)

Проведем плоскость через N таким образом, чтобы ни одна неоптимальная траектория не доходила до данной плоскости. Местоположение данной плоскости характеризуется вектором , который соответствует нормали к данной плоскости в точке N. Отрезок NL соответствует (  х) вариации неоптимальной траектории относительно оптимальной в момент времени tf.

Между вектором  и NL имеем тупой угол, который соответствует негативному значению скалярного произведения этих векторов

(6.26)

Можно записать составляющие данного неравенства

(6.27)

или

. (6.28)

Данное неравенство может превратиться в равенство при максимальном значении произведения

. (6.29)

Из этого условия возникло наименование «принцип максимума». Для оценки взаимосвязи координат объекта и вектора  примем, что

. (6.30)

Продифференцировав выражение (6.30), имеем

; (6.31)

.

Откуда следует

(6.32)

или, используя выражение (6.29), запишем

. (6.33)

Система дифференциальных уравнений получила наименование сопряженной и ее решение возможно совместно с основной моделью движения объекта:

(6.34)

при условии задания начальных или граничных условий на координаты х и . Поскольку вектор  введен искусственно, то одна из основных проблем при использовании данного метода заключается в неопределенности начальных или граничных координат . Для критериев качества, отличных от критерия быстродействия, используется процедура замены критерия новой координатой объекта управления. Например, имеем интегральный критерий качества вида

. (6.35)

Обозначив J через дополнительную координату x­n+1, получим

. (6.36)

Присоединяем ее к основной модели динамики движения объекта управления:

(6.37)

или в виде

.

Относительно расширенной модели формируется функция

. (6.38)

Функцию Н часто называют функцией Гамильтона. Если ищется минимум J, то n+1 = 1, а при поиске максимума J1 принимаем n+1 = 1.

Рассмотрим пример задачи о предельном быстродействии динамической системы:

;

,

которую нужно перевести из х1(0) = х2(0) = 0 в заданное состояние x1f и x2f .

Управляющее воздействие ограничено

.

Составим функцию Гамильтона:

.

Сопряженная система имеет вид

;

.

Интегрируя данную систему, имеем

что позволяет записать Н в виде

.

Максимум функции Н достигается при условии

.

Таким образом, оптимальное значение u(t) соответствует своим предельным значениям. При t = t1 управляющее воздействие меняет знак:

c2c1t1 = 0 и t1 = c2/c1.

На интервале времени [0, t1] закон управления определяется

u(t) = umsignc2,

что позволяет с учетом нулевых начальных условий х1(0) = х2(0) = 0 записать решения уравнений движения объекта в виде

.

Для интервала времени [t, tf] имеем

u(t) = umsignc2

и

С учетом граничных условий для tf находим

.

Поскольку tf t1, то выражение имеет следующий вид:

.

Равенство имеет место, когда процесс состоит из одного интервала. Значение для t1 определяется неравенством

.

На основании полученных неравенств можно определить sign C2:

при и ;

при и .

Дополнительные исследования знаков sign C2 при x1f > 0, x2f > 0 и

х1f < 0, x2f < 0 позволяют записать следующие неравенства:

, если ;

, если .

Рассмотрим для приведенного объекта синтез закона управления, который минимизирует интегральный квадратичный критерий:

.

Введем переменную

x3 = J

и

.

Функция Гамильтона для расширенной модели имеет вид

.

Максимальное значение Н находим из условия

.

Откуда находим оптимальный закон управления:

.

Сопрягающая система имеет следующий вид:

Перепишем уравнение для оптимального управления

;

.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]