- •Введение
- •1. Основные задачи теории автоматического управления
- •Формулировка задачи управления
- •Математическая модель объекта управления
- •1.3. Управляющая система и объект автоматического управления
- •1.4. Закон обратной связи
- •1.5. Общая задача теории автоматического управления
- •2. Математические модели сау
- •2.1. Построение модели элемента системы управления
- •2.2. Динамические и статические звенья сау
- •2.3. Составление дифференциальных уравнений систем автоматического управления
- •2.4. Примеры составления дифференциальных уравнений звеньев сау
- •2.5. Типовые динамические звенья линейных сау
- •2.6. Соединение звеньев и преобразование структурных схем сау
- •2.7. Вопросы идентификации моделей объектов управления
- •3. Методы исследования линейных сау
- •3.1. Общая модель линейной непрерывной и дискретной сау
- •3.2. Линейные сау, описываемые обыкновенными дифференциальными уравнениями с постоянными коэффициентами
- •3.3. Дискретные линейные сау
- •4.1. Метод фазовой плоскости
- •4.2. Линеаризация нелинейных дифференциальных уравнений
- •4.3. Автоколебания нелинейных сау
- •5. Устойчивость систем автоматического управления
- •5.1. Основные понятия теории устойчивости (математическая формулировка)
- •5.2. Общие теоремы об устойчивости линейных сау
- •5.3. Устойчивость линейной сау с постоянной матрицей
- •5.4. Связь устойчивости с корнями характеристического уравнения
- •5.5. Критерии устойчивости
- •5.6. Алгебраические критерии устойчивости
- •5.7. Частотные критерии устойчивости
- •5.8. Логарифмический критерий устойчивости
- •5.9. Запас устойчивости по фазе и амплитуде
- •5.10. Устойчивость импульсных сау
- •5.11. Устойчивость нелинейных сау
- •6. Качество систем автоматического управления
- •6.1. Показатели качества переходного процесса
- •6.2. Прямые методы определения показателей качества
- •6.3. Связь переходного процесса с вещественной частотной характеристикой системы
- •6.4. Интегральные оценки качества
- •7. Случайные воздействия в линейных сау
- •7.1. Понятие случайной функции
- •7.2. Основные характеристики случайной функции
- •7.3. Стационарные случайные функции
- •7.4. Спектральное представление стационарной случайной функции
- •7.5. Спектральная плотность стационарной случайной функции
- •7.6. Преобразование стационарной случайной функции стационарной линейной динамической системой
- •7.7. Преобразование случайных сигналов безынерционными нелинейными звеньями
- •7.8. Понятие статистически оптимальной линейной системы
- •7.9. Статистическая проверка гипотез
- •8. Задачи оптимального управления
- •8.1. Экстремумы функций. Принцип Лагранжа
- •8.2. Начала вариационного исчисления
- •8.3. Прямые методы решения задач оптимального управления
- •8.4. Принцип максимума Понтрягина
- •8.5. Оптимальное позиционное управление (динамическое программирование)
- •9. Современные тенденции развития систем управления
- •9.1. Управление при неполной начальной информации
- •9.2. Экстремальные сау
- •9.3. Самонастраивающиеся системы (снс)
- •9.4. Самоорганизующиеся и самообучающиеся сау
- •9.5. Автоматизированные системы управления
- •9.6. Роботы и гибкие производственные системы
- •9.7. Математические методы в управлении роботами и гпс
8. Задачи оптимального управления
Задачи, рассматриваемые в математической теории оптимального управления, возникли из практических потребностей, прежде всего в области механики космических полетов и теории автоматического управления, примерно 30-40 лет назад. Эти задачи иногда называют неклассическими задачами вариационного исчисления, подчеркивая тем самым преемственность идей и методов решения. Теоретические основы классического вариационного исчисления были заложены в XVIII веке Леонардом Эйлером и Жозефом Луи Лагранжем. Вариационное исчисление в свою очередь развилось из проблем, которые возникали при нахождении максимумов или минимумов функций.
Экстремальные задачи (задачи на максимум и минимум) пронизывают практически все области современного естествознания. «В мире не происходит ничего, в чем бы не был виден смысл какого-нибудь максимума или минимума» - писал Эйлер.
Надо сразу сказать, что решение всех задач, рассматриваемых в этой главе, основано на численных методах, причем, как правило, реализуемых на ЭВМ. Ручной счет не в состоянии справиться с тем огромным числом необходимых выкладок, которые требуют практические задачи. Пусть вас не вводят в заблуждение специально сконструированные, простые примеры решения задач, даваемые в этой главе.
На основе математических методов, излагаемых ниже, разработано и разрабатываются многочисленные стандартные программы и пакеты прикладных программ разнообразного назначения. Это весьма обширная область, которой посвящены многочисленные монографии, десятки учебников и множество журнальных статей.
8.1. Экстремумы функций. Принцип Лагранжа
Начнем с простейшего случая - поиска экстремума функции одного переменного и, последовательно усложняя задачу, покажем, как трансформировались идеи ее решения на каждой стадии усложнения, приведя в конечном итоге к решению задач оптимального управления.
8.1.1. Экстремумы функций одного переменного. Для формализованной задачи: найти максимум (минимум) функции f0(x) при условии х [а,b] , будем употреблять запись
(8.1.1)
где а и b могут принимать и бесконечные значения. Условие (8.1.1) называют ограничением. Если х [-∞,+∞], то говорят, что задача (8.1.1) не имеет ограничений (без ограничений).
Определение
8.1.1.
Точка
называется
абсолютным
максимумом (минимумом) задачи
(8.1.1), если
(8.1.2)
для любого х [а, b].
Определение 8.1.2. Точка х называется локальным максимумом (минимумом) в задаче (8.1.1), если можно указать такое число ε>0, что для всех точек х [а, b] , удовлетворяющих неравенству
(8.1.3)
выполняется неравенство
(8.1.4)
Различают точки строгого и нестрогого максимума (минимума) (как абсолютного, так и локального). В случае нестрогого максимума записи (8.1.2) и (8.1.4) остаются в силе. При строгом же максимуме (минимуме) знак неравенства ≤(≥) переходит в <(>). Очевидно, что при этом в условиях (8.1.2), (8.1.4) считается х ≠ (х≠х0).
Заметим, что не всякая задача (8.1.1) имеет решение. Например, в задаче без ограничений f0(x) = -1/(1 + х2)→max функция f0(x)≤ 0, и нет такой точки , где f0( )=0. С другой стороны, если взять точки хп=п (п=1,2,...), то f0(xn)→0. Отсюда следует, что максимума в данной задаче не существует, то есть нельзя указать такую точку , что f0(x)≤ f0( ) для всех х.
Однако существует теорема Вейерштрасса, которая дает в огромном числе случаев гарантию существования решения.
Теорема Вейерштрасса. Пусть f0(х) - непрерывная функция на конечном отрезке [а, b]. Тогда решение задачи (8.1.1) существует.
Следствием этой теоремы является утверждение: пусть f0(x) непрерывна на всей прямой. Тогда если выполняется
(8.1.5)
то решение задачи без ограничений
f0(x)→min (8.1.6)
существует.
Для отыскания решения задачи (8.1.1) будем использовать прием, впервые примененный П. Ферма в 1629 г., но опубликованный спустя полстолетия.
Теорема
Ферма.
Пусть
функция f0(x)
является дифференцируемой в точке
.
Тогда, если точка
доставляет локальный экстремум (минимум
или максимум) этой функции, то
(8.1.7)
Точки, для которых выполняется условие (8.1.7), называются стационарными. Стационарные точки совместно с концевыми точками называются критическими.
Соотношение (8.1.7) является лишь необходимым условием экстремума. Так, для функции f0(x)=xs точка =0 является стационарной, но никакого локального экстремума не дает.
Теорема Вейерштрасса и теорема Ферма позволяют сделать следующее утверждение: если функция f0(x) непрерывна на конечном отрезке [а, b] и дифференцируема во внутренних точках х, а<х<b, то решение задачи (8.1.1) находится среди критических точек.
Таким образом, правило поиска решения одномерных задач типа (8.1.1) следующее: 1) найти стационарные точки функции f0(x) и значения функции в них; 2) путем перебора всех критических значений функции f0 выбрать максимальное (минимальное) значение среди них.
8.1.2. Экстремумы функций многих переменных. Принцип Лагранжа. Пусть f0, f1,..., fm - функции п переменных X=(х1, х2,...,хп) или, что то же самое, функции вектора X. Рассмотрим задачу
f0(X)→max(min) (8.1.8)
с ограничениями типа равенств
fi(X)=0 (i=1, 2,…,m). (8.1.9)
Обозначим через С совокупность допустимых точек в задаче (8.1.8), определяемую условиями (8.1.9). Множество С называется ограниченным, если существует константа А > 0 такая, что для любой точки Х= (х1,х2,...,хп) из С выполняется
(j=1,
2, ...,п).
(8.1.10)
Теперь обобщим положения п. 8.1.1.
Определение
8.1.3
(аналог определения 8. 1.1). Точка Х=
называется
абсолютным
максимумом (минимумом) в
задаче (8.1.8), (8.1.9), если для любого X
С
выполняется
(8.1.11)
Определение
8.1.4
(аналог определения 8.1.2).
Точка
называется
локальным
максимумом (минимумом) в
задаче (8.1.8), (8.1.9), если можно указать
такое число ε
> 0,
что для всех точек X
С,
удовлетворяющих
неравенству
(j=1,
2, ...,п),
(8.1.12)
выполнено неравенство
(8.1.13)
Обобщение теоремы Вейерштрасса. Пусть в задаче (8.1.8), (8.1.9) функции f0, f1,...,fm непрерывны, а множество допустимых точек ограничено. Тогда решение задачи (8.1.8), (8.1.9) существует.
Следствие. Пусть функция f0(X) непрерывна для любого Х=(х1,х2,..., хп). Тогда если
lim
f0
(X)=∞
при
то решение задачи без ограничений f0(x) →min существует.
Обобщение
теоремы Ферма. Пусть
в точке
существуют все частные производные f0.
Если
точка
доставляет локальный экстремум этой
функции, то
(j=1,2,...,п).
(8.1.14)
Часто
для сокращения записи используют значок
или
grad
(градиент). Таким образом, (8.1.14) эквивалентно
f0= 0 при х=х0, (8.1.14а)
или
grad f0=0 при х=х0. (8.1.14б)
Точки, для которых все частные производные равны нулю, называются стационарными. Очевидно, что условия (8.1.14), как и ранее условие (8.1.7), являются необходимыми, но не достаточными.
Дадим теперь рецепт решения задачи (8.1.8), (8.1.9) (принцип Лагранжа), сформулированный Жозефом Луи Лагранжем: «Можно высказать следующий принцип. Если ищется максимум или минимум некоторой функции многих переменных при условии, что между этими переменными имеется связь, задаваемая одним или несколькими уравнениями, нужно прибавить к функции, экстремум которой мы ищем, функции, задающие уравнение связи, умноженные на неопределенные множители, и искать затем максимум или минимум построенной суммы, как если бы переменные были независимы. Полученные уравнения, присоединенные к уравнениям связи, послужат для определения всех неизвестных».
Следуя этому рецепту, проделаем соответствующие математические выкладки. Составим сумму
L(X, Λ)=λ0f0(x)+ λ1f1(x)+…+ λmfm(x), (8.1.15)
где X=(х1, х2,...,хп), Λ=(λ0, λ1,...,λт). Функцию L(X,Λ) называют функцией Лагранжа, а числа λ0, λ1,...,λт называются множителями Лагранжа. Далее в соответствии с принципом Лагранжа получаем уравнения
(j=1,
2, ...,m),
(8.1.16)
дополненные уравнениями связи
(i=1,
2,..., m),
(8.1.17)
которые необходимо решить относительно х1, х2,..., хп, λ0, λ1,...,λт и среди этих решений выбрать нужное.
Из сформулированных ранее теорем следует, что если совокупность (множество) допустимых точек ограничена и все функции f0,f1,…,fm непрерывны вместе со всеми частными производными, то описанное правило приведет к решению задачи.
Пример.
Найти стороны прямоугольника максимальной
площади, вписанного в окружность
Площадь f0 прямоугольника можно записать в виде f0=4x1x2. Тогда L (X, Λ)=λ04x1x2+
+λ1
,
а необходимые условия экстремума
даются условиями
Отсюда
получаем λ1/λ0=±2
и х1=х2=R
.
Сделаем несколько замечаний. Во-первых, условия (8.1.16) и (8.1.17) дают п + m уравнений с п +m+ 1 неизвестными. Однако надо иметь в виду, что множители Лагранжа можно умножить на любую константу, отличную от нуля, то есть всегда считать один из множителей Лагранжа равным единице. Тогда число уравнений в (8.1.16) и (8.1.17) фактически равно числу неизвестных. Во-вторых, уравнения (8.1.16) содержательны с точки зрения нахождения экстремума, только если λ0 ≠ 0. Ведь если λ0=0, то уравнения (8.1.16) отражают лишь вырожденность ограничений и не связаны с функцией, экстремум которой ищется.
В данном разделе была рассмотрена задача нахождения экстремума при ограничениях типа равенств. Естественно, было бы следующим шагом рассмотреть более общий случай, когда ограничения могут иметь вид равенств и неравенств. Однако эта задача в общем случае столь сложна, что ей посвящены исследования целого раздела современной математики, называемого математическим программированием. В главе 9 дан пример из этой области математики. Для более подробного изучения математического программирования отсылаем интересующихся к литературе, а сами продолжим наш путь к задаче оптимального управления.
