Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
OTAU lecture 1.docx
Скачиваний:
4
Добавлен:
01.07.2025
Размер:
1.96 Mб
Скачать

8. Задачи оптимального управления

Задачи, рассматриваемые в математической тео­рии оптимального управления, возникли из практиче­ских потребностей, прежде всего в области механики космических полетов и теории автоматического упра­вления, примерно 30-40 лет назад. Эти задачи иногда называют неклассическими задачами вариа­ционного исчисления, подчеркивая тем самым преем­ственность идей и методов решения. Теоретические основы классического вариационного исчисления были заложены в XVIII веке Леонардом Эйлером и Жозефом Луи Лагранжем. Вариационное исчисление в свою очередь развилось из проблем, которые возни­кали при нахождении максимумов или минимумов функций.

Экстремальные задачи (задачи на максимум и ми­нимум) пронизывают практически все области совре­менного естествознания. «В мире не происходит ни­чего, в чем бы не был виден смысл какого-нибудь максимума или минимума» - писал Эйлер.

Надо сразу сказать, что решение всех задач, рас­сматриваемых в этой главе, основано на численных методах, причем, как правило, реализуемых на ЭВМ. Ручной счет не в состоянии справиться с тем огром­ным числом необходимых выкладок, которые требуют практические задачи. Пусть вас не вводят в заблужде­ние специально сконструированные, простые примеры решения задач, даваемые в этой главе.

На основе ма­тематических методов, излагаемых ниже, разработано и разрабатываются многочисленные стандартные про­граммы и пакеты прикладных программ разнообраз­ного назначения. Это весьма обширная область, кото­рой посвящены многочисленные монографии, десятки учебников и множество журнальных статей.

8.1. Экстремумы функций. Принцип Лагранжа

Начнем с простейшего случая - поиска экстрему­ма функции одного переменного и, последовательно усложняя задачу, покажем, как трансформировались идеи ее решения на каждой стадии усложнения, при­ведя в конечном итоге к решению задач оптимального управления.

8.1.1. Экстремумы функций одного переменного. Для формализованной задачи: найти максимум (ми­нимум) функции f0(x) при условии х [а,b] , будем употреблять запись

(8.1.1)

где а и b могут принимать и бесконечные значения. Условие (8.1.1) называют ограничением. Если х [-∞,+∞], то говорят, что задача (8.1.1) не имеет ограничений (без ограничений).

Определение 8.1.1. Точка называется абсо­лютным максимумом (минимумом) задачи (8.1.1), если

(8.1.2)

для любого х [а, b].

Определение 8.1.2. Точка х называется ло­кальным максимумом (минимумом) в задаче (8.1.1), если можно указать такое число ε>0, что для всех точек х [а, b] , удовлетворяющих неравенству

(8.1.3)

выполняется неравенство

(8.1.4)

Различают точки строгого и нестрогого максимума (минимума) (как абсолютного, так и локального). В случае нестрогого максимума записи (8.1.2) и (8.1.4) остаются в силе. При строгом же максимуме (минимуме) знак неравенства ≤(≥) переходит в <(>). Очевидно, что при этом в условиях (8.1.2), (8.1.4) считается х ≠ (х≠х0).

Заметим, что не всякая задача (8.1.1) имеет ре­шение. Например, в задаче без ограничений f0(x) = -1/(1 + х2)→max функция f0(x)≤ 0, и нет такой точки , где f0( )=0. С другой стороны, если взять точки хп=п (п=1,2,...), то f0(xn)→0. От­сюда следует, что максимума в данной задаче не су­ществует, то есть нельзя указать такую точку , что f0(x)≤ f0( ) для всех х.

Однако существует теорема Вейерштрасса, ко­торая дает в огромном числе случаев гарантию суще­ствования решения.

Теорема Вейерштрасса. Пусть f0(х) - не­прерывная функция на конечном отрезке [а, b]. Тогда решение задачи (8.1.1) существует.

Следствием этой теоремы является утверждение: пусть f0(x) непрерывна на всей прямой. Тогда если выполняется

(8.1.5)

то решение задачи без ограничений

f0(x)→min (8.1.6)

существует.

Для отыскания решения задачи (8.1.1) будем ис­пользовать прием, впервые примененный П. Ферма в 1629 г., но опубликованный спустя полстолетия.

Теорема Ферма. Пусть функция f0(x) является дифференцируемой в точке . Тогда, если точка доставляет локальный экстремум (минимум или мак­симум) этой функции, то

(8.1.7)

Точки, для которых выполняется условие (8.1.7), называются стационарными. Стационарные точки сов­местно с концевыми точками называются критиче­скими.

Соотношение (8.1.7) является лишь необходимым условием экстремума. Так, для функции f0(x)=xs точка =0 является стационарной, но никакого ло­кального экстремума не дает.

Теорема Вейерштрасса и теорема Ферма позво­ляют сделать следующее утверждение: если функция f0(x) непрерывна на конечном отрезке [а, b] и диф­ференцируема во внутренних точках х, а<х<b, то решение задачи (8.1.1) находится среди критических точек.

Таким образом, правило поиска решения одномер­ных задач типа (8.1.1) следующее: 1) найти стацио­нарные точки функции f0(x) и значения функции в них; 2) путем перебора всех критических значений функции f0 выбрать максимальное (минимальное) значение среди них.

8.1.2. Экстремумы функций многих переменных. Принцип Лагранжа. Пусть f0, f1,..., fm - функции п переменных X=1, х2,...,хп) или, что то же самое, функции вектора X. Рассмотрим задачу

f0(X)→max(min) (8.1.8)

с ограничениями типа равенств

fi(X)=0 (i=1, 2,…,m). (8.1.9)

Обозначим через С совокупность допустимых то­чек в задаче (8.1.8), определяемую условиями (8.1.9). Множество С называется ограниченным, если суще­ствует константа А > 0 такая, что для любой точки Х= (х12,...,хп) из С выполняется

(j=1, 2, ...,п). (8.1.10)

Теперь обобщим положения п. 8.1.1.

Определение 8.1.3 (аналог определения 8. 1.1). Точка Х= называется абсолютным максимумом (минимумом) в задаче (8.1.8), (8.1.9), если для любого X С выполняется

(8.1.11)

Определение 8.1.4 (аналог определения 8.1.2). Точка называется локальным максимумом (минимумом) в задаче (8.1.8), (8.1.9), если можно указать такое число ε > 0, что для всех точек X С, удовлетворяющих неравенству

(j=1, 2, ...,п), (8.1.12)

выполнено неравенство

(8.1.13)

Обобщение теоремы Вейерштрасса. Пусть в задаче (8.1.8), (8.1.9) функции f0, f1,...,fm непрерывны, а множество допустимых точек ограни­чено. Тогда решение задачи (8.1.8), (8.1.9) сущест­вует.

Следствие. Пусть функция f0(X) непрерывна для любого Х=(х12,..., хп). Тогда если

lim f0 (X)=∞ при

то решение задачи без ограничений f0(x) →min суще­ствует.

Обобщение теоремы Ферма. Пусть в точке существуют все частные производные f0. Если точка доставляет локальный экстремум этой функ­ции, то

(j=1,2,...,п). (8.1.14)

Часто для сокращения записи используют значок или grad (градиент). Таким образом, (8.1.14) экви­валентно

f0= 0 при х=х0, (8.1.14а)

или

grad f0=0 при х=х0. (8.1.14б)

Точки, для которых все частные производные равны нулю, называются стационарными. Очевидно, что ус­ловия (8.1.14), как и ранее условие (8.1.7), являются необходимыми, но не достаточными.

Дадим теперь рецепт решения задачи (8.1.8), (8.1.9) (принцип Лагранжа), сформулированный Жозефом Луи Лагранжем: «Можно высказать следую­щий принцип. Если ищется максимум или минимум некоторой функции многих переменных при условии, что между этими переменными имеется связь, задавае­мая одним или несколькими уравнениями, нужно при­бавить к функции, экстремум которой мы ищем, функ­ции, задающие уравнение связи, умноженные на неоп­ределенные множители, и искать затем максимум или минимум построенной суммы, как если бы перемен­ные были независимы. Полученные уравнения, присоединенные к уравнениям связи, послужат для опре­деления всех неизвестных».

Следуя этому рецепту, проделаем соответствующие математические выкладки. Составим сумму

L(X, Λ)0f0(x)+ λ1f1(x)+…+ λmfm(x), (8.1.15)

где X=(х1, х2,...,хп), Λ=0, λ1,...,λт). Функцию L(X) называют функцией Лагранжа, а числа λ0, λ1,...,λт называются множителями Лагранжа. Да­лее в соответствии с принципом Лагранжа получаем уравнения

(j=1, 2, ...,m), (8.1.16)

дополненные уравнениями связи

(i=1, 2,..., m), (8.1.17)

которые необходимо решить относительно х1, х2,..., хп, λ0, λ1,...,λт и среди этих решений выбрать нужное.

Из сформулированных ранее теорем следует, что если совокупность (множество) допустимых точек ог­раничена и все функции f0,f1,…,fm непрерывны вме­сте со всеми частными производными, то описанное правило приведет к решению задачи.

Пример. Найти стороны прямоугольника максимальной площади, вписанного в окружность

Площадь f0 прямоугольника можно записать в виде f0=4x1x2. Тогда L (X, Λ)=λ04x1x2+

1 , а необ­ходимые условия экстремума даются условиями

Отсюда получаем λ10=±2 и х12=R .

Сделаем несколько замечаний. Во-первых, условия (8.1.16) и (8.1.17) дают п + m уравнений с п +m+ 1 неизвестными. Однако надо иметь в виду, что множи­тели Лагранжа можно умножить на любую констан­ту, отличную от нуля, то есть всегда считать один из множителей Лагранжа равным единице. Тогда число уравнений в (8.1.16) и (8.1.17) фактически равно чис­лу неизвестных. Во-вторых, уравнения (8.1.16) содер­жательны с точки зрения нахождения экстремума, только если λ0 0. Ведь если λ0=0, то уравнения (8.1.16) отражают лишь вырожденность ограничений и не связаны с функцией, экстремум которой ищется.

В данном разделе была рассмотрена задача нахо­ждения экстремума при ограничениях типа равенств. Естественно, было бы следующим шагом рассмотреть более общий случай, когда ограничения могут иметь вид равенств и неравенств. Однако эта задача в об­щем случае столь сложна, что ей посвящены исследо­вания целого раздела современной математики, назы­ваемого математическим программированием. В гла­ве 9 дан пример из этой области математики. Для более подробного изучения математического програм­мирования отсылаем интересующихся к литерату­ре, а сами продолжим наш путь к задаче оптималь­ного управления.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]