
- •Раздел 2. Некоторые критерии оптимальности. 9
- •1. Введение. Основные понятия и определения.
- •1.1. Задача нахождения алгоритмов управления.
- •Раздел 2. Некоторые критерии оптимальности.
- •2.1. Задача о максимальном быстродействии.
- •2.2. Задача синтеза систем по интегральным критериям качества переходных процессов.
- •2.3. Задача ограничения энергетических ресурсов.
- •3. Математические основы теории оптимальных систем.
- •3.1. Функционалы, вариации и их свойства.
- •3.2. Понятие линейности функционала.
- •3.3. Уравнение Эйлера. Уравнение Эйлера-Пуассона. Условия трансверсальности.
- •3.4. Задачи на условный экстремум.
- •3.5. Принцип максимума.
- •3.6. Динамическое программирование.
- •3.7. Способы нахождения фазовых траекторий.
- •4. Управление, оптимальное по быстродействию, в разомкнутых системах.
- •4.1. Нахождение оптимальных управлений с помощью принципа максимума. Теорема об “n” интервалах.
- •4.2. Физическая сущность управления, оптимального по быстродействию.
- •4.3. Определение моментов переключения в линейных оптимальных управлениях.
- •4.4. Определение моментов переключения при дополнительных ограничениях, накладываемых на координаты.
- •4.5. Нахождение моментов переключения в нелинейных оптимальных управлениях.
- •4.6. Определение знака первого интервала.
- •5. Управление, близкое к оптимальному.
- •5.1. Уменьшение количества интервалов управления.
- •Перечень заданий для самостоятельной работы.
- •Список литературы
- •443100, Самара, ул. Молодогвардейская,244. Корпус №8
4. Управление, оптимальное по быстродействию, в разомкнутых системах.
4.1. Нахождение оптимальных управлений с помощью принципа максимума. Теорема об “n” интервалах.
Из
всех методов нахождения оптимальных
управлений для решения задач о
быстродействии наиболее целесообразно
применять принцип максимума. Сформулируем
задачу о быстродействии. В n-мерном
фазовом пространстве в момент времени
задан вектор состояния объекта
;
дано его конечное значение в момент
времени
.
Объект управления описывается дифференциальным уравнением в векторной форме
.
(4.1)
На
управление накладывается ограничение
.
Задан функционал быстродействия.
.
(4.2)
Требуется
определить такой вектор
,
при котором время перехода объекта
из
в
минимально. Предполагается, что
определены для любых значений
,
соответствующих области управления
.
Кроме этого, функции
непрерывны по всем переменным
и дифференцируемы по
.
Управление может принадлежать к классу
кусочно-непрерывных функций, содержащих
разрывы первого рода.
Решение
задачи с помощью принципа максимума
проводится по следующей схеме.
Записывается функция Гамильтона Н
[см. (3.25)], равная скалярному произведению
векторов
и
.
Берется частная производная от Н по и, которая определяет экстремум функции,
.
Эта
производная зависит от одного или
нескольких составляющих вектора
.
Функции
меняются во времени. Для максимума H,
как это требует принцип, необходимо,
чтобы
при
и
при
,
т. е.
.
Таким образом, требуется определить,
сколько раз
,
меняет знак, или иначе говоря, сколько
корней имеет функция.
У
Рис.4.1. Оптимальный
алгоритм
Рис.4.2. Соединение
звеньев: а
— последовательное, б, в
—
параллельное,
г
— нелинейный объект
,
или
,
как показано на рис. 4.1. При этом время
перехода вектора состояния из начального
состояния в конечное будет минимальным.
Моменты смены знака управляющего
воздействия называются моментами
переключения. Характерные
особенности строго оптимального
процесса следующие: процесс должен
происходить за конечное время; в момент
окончания управления и после него
координаты объекта должны иметь заданное
значение.
Найдем оптимальные управления для трех структурных схем (рис. 4.2). Схема, представленная на рис. 4.2, а, достаточно известна и многократно описана в различных монографиях, а показанные на рис. 4.2, б, в, менее известны, поэтому остановимся на них подробнее. Схема, изображенная на рис. 4.2, б, применяется тогда, когда мощный поток материала или энергии по тем или иным причинам нельзя переработать в одном агрегате. Такие схемы особенно часто встречаются в химическом, обогатительном, металлургическом, цементном и т. д. производстве.
Схема, представленная на рис. 4.2, в, также нашла широкое применение в промышленности и на транспорте, например, в электровозах, у которых для привода колесных пар используется несколько двигателей, моменты которых суммируются; в технологических линиях бумажной и горной промышленности, где после переработки несколькими агрегатами готовые продукты поступают в смесители, отстойники и т. д.
Рассмотрим
схему, показанную на рис. 4.2, а.
Предположим, что каждое звено описывается
линейным дифференциальным уравнением
первого порядка с постоянными
коэффициентами. В качестве фазовых
координат выбираем
.
Тогда структурная схема описывается
следующей системой уравнений в нормальной
форме:
(4.3)
где
Составим функцию Гамильтона
(4.4)
Возьмем частную производную от Н по u
(4.5)
и определим закон управления
Значит,
требуется определить поведение функции
.
Для этого составляем уравнения для
функций
:
(4.6)
Решаем систему (4.6), начиная с последнего уравнения,
где
-
постоянная интегрирования, определяемая
начальными условиями, для
.
Отсюда
Продолжая решение, получим
(4.7)
Покажем,
что функция
имеет не более
действительных корней. Доказательство
проведем методом математической
индукции.
Обозначим
число действительных корней функции
через N.
За базу индукции примем
,
N = 0.
Это очевидно, так как функция
при
действительных корней не имеет.
Предположим, что
имеет N
корней. Разделим функцию
на знакопостоянный член еt/Tn
,
что не изменит количества ее корней. В
результате деления получим
(4.8)
Возьмем
производную от
(4.9)
Выражение
(4.9) содержит
член, так как
различные числа и их разности не равны
нулю.
По
известной теореме Ролля между двумя
действительными корнями функции лежит,
по крайней мере, один корень ее
производной. Значит
должна иметь
(N—1)
корней, так как по предположению
имеет N
корней. Но по базе индукции
должна иметь (N—2)
корней, так как она содержит член. Такое
противоречие и является доказательством
того, что функция
имеет не более действительных
корней.
Если вместо системы нормальных уравнений объект описывается одним дифференциальным уравнением n-го порядка и корни его характеристического уравнения отрицательные вещественные и различные, то решение для функций будет аналогично решению (4.7). Следовательно, если функция имеет (N —1) корней, то она меняет раз знак. Тогда для оптимального управления требуется п интервалов и знаки на интервалах чередуются раз.
Если среди корней характеристического уравнения имеются кратные или нулевые, то это не меняет количество интервалов управления. Данное утверждение представляем доказать самим читателям.
Сформулируем
теорему об
«п» - интервалах,
которая впервые была выдвинута и
доказана А. А. Фельдбаумом. «Если объект
управления описывается линейным
дифференциальным уравнением n-го
порядка с постоянными коэффициентами
и корни его характеристического
уравнения вещественные отрицательные
или нулевые, то для оптимального
управления необходимо и достаточно п
интервалов максимального значения
управления
,
а знаки на интервалах должны чередоваться
раз». Теорема об п
интервалах значительно облегчает
нахождение оптимальных управлений,
так как она исключает необходимость
определения функций
и их анализа. Важно, чтобы были соблюдены
условия теоремы, которые проверяются
легко, когда объект описывается
нормальной системой дифференциальных
уравнений.
Перейдем к схеме, изображенной на рис. 4.2, б. Она описывается следующей системой уравнений:
(4.10)
где
.
Составим функцию Гамильтона
(4.11)
Возьмем производную от Н по u
(4.12)
и определим закон управления
.
Таким
образом, функция Н
зависит от суммы всех составляющих
вектора
.
Определим функции
(4.13)
Запишем решения для функций
Подставляем полученные выражения в (4.12)
(4.14)
Из
предыдущего известно, что функция
имеет (N—1)
действительных
корней. Таким образом, для оптимального
управления необходимо n
интервалов максимального значения
управления
;
при этом знаки на интервалах должны
чередоваться (n
- 1) раз. Если в структурной схеме
содержатся звенья с одинаковыми
динамическими свойствами, т. е. имеют
одинаковые постоянные времени Т,
то количество интервалов управления
будет равно
,
где k
— число
звеньев с одинаковыми динамическими
свойствами. При
требуется всего один интервал управления.
Справедливость последнего утверждения
предлагается доказать читателям.
Рассмотрим схему, представленную на рис.4.2, в. Она описывается следующей системой уравнений:
(4.15)
где
.
Начальное
состояние объекта
.
Конечное состояние будет находиться
на гиперплоскости, которая дается
уравнением
.
Эта задача является задачей с подвижным
правым концом, для которой требуется
соблюдение условий трансверсальности.
Составим функцию Гамильтона
(4.16)
Найдем частную производную от Н по u
(4.17)
и определим функцию
Функции
;
имеют такие же решения, как и в предыдущем
случае; следовательно,
(4.18)
Постоянные
интегрирования в (4.18) выбираем так,
чтобы на конце управления соблюдались
условия трансверсальности. Для этого
вектор
на конце управления должен быть
параллелен вектору grad
М,
который имеет одно и то же значение в
любой точке гиперплоскости. Найдем
вектор градиента
(4.19)
В
момент окончания управления,
составляющие вектора
должны быть равны составляющим градиента
(4.20)
Из (4.20) находим постоянные интегрирования
Все
числа
положительные. Подставим значения Сi,
в (4.18), после чего получим
Функция
знака не меняет, так как все члены при
изменении
возрастают, а
остаются положительными. Значит, попасть
за минимальное время на гиперплоскость
можно с помощью только одного интервала
управления при
На основе трех приведенных структурных схем могут быть рассмотрены различные комбинации параллельно-последовательного соединения звеньев и получены для них оптимальные управления.
К данной задаче сводится случай, когда объект описывается уравнением
(4.21)
Непосредственно применить принцип максимума к такому объекту нельзя, так как меняться скачком может не только высшая производная. Этим нарушается основное условие принципа максимума о непрерывности изменения координат.
Уравнение (4.21) приводится к системе п уравнений в нормальной форме. Координаты, входящие в полученную таким образом систему уравнений, непрерывны, а поэтому правомерно использование принципа максимума. Каждой системе нормальных уравнений сопоставляется некоторая структурная схема. Легко показать, что нормальная система уравнений, соответствующая (4.21), представляется структурной схемой (рис. 4.2, в).
Рассмотрим оптимальное управление объектами, которые содержат нелинейные звенья (рис. 4.2, е). Объект, состоящий из линейного 1 и нелинейного звена 2, описывается следующей системой уравнений:
(4.22)
где
Функции
и
непрерывны вместе со своими производными,
причем
и
.
Начальное состояние объекта
,
конечное состояние
,
.
Требуется за минимальное время перевести объект из начального состояния в конечное.
Запишем функцию Гамильтона
(4.23)
Возьмем частную производную от Н по u
(4.24)
и определим функцию
Для нахождения составляем уравнения сопряженных функций :
(4.25)
Решим уравнения (4.25):
(4.26)
Для
определения алгоритма проанализируем
поведение функций
и
.
Функция
знака не меняет, так как экспоненциальный
член всегда положителен. Таким образом,
производная от функций
знакопостоянна, а сама функция
по теореме Ролля только один раз меняет
знак. Значит, оптимальное управление
должно иметь два интервала (разгон —
торможение) с одной сменой знака. Данный
пример показывает, что если в объекте
управления имеются нелинейные звенья,
то для нахождения оптимальных управлений
необходимо исследовать свойства
нелинейных функций, их производных и
интегралов. В большинстве случаев эти
исследования могут быть очень сложными.
Без доказательства укажем, что если
функции, описывающие нелинейные звенья,
обладают ранее указанными свойствами,
то все выводы, сделанные для схем (см.
рис. 4.2), справедливы и для нелинейных
звеньев. Так как свойства таких нелинейных
объектов совпадают со свойствами
линейных, то их можно назвать
квазилинейными.
Выше были рассмотрены оптимальные управления для случая нулевых начальных и ненулевых конечных условий. Часто рассматриваются оптимальные управления по ошибке системы, т. е. по отклонению от конечного состояния. Тогда задача несколько изменяется, так как начальные условия будут ненулевыми, а конечные - нулевыми. Для рассмотренных объектов такая трансформация не вызывает изменений в определении оптимальных алгоритмов.