Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекции по МОТС / лекции МОТС / Методы оптимитизации.doc
Скачиваний:
145
Добавлен:
15.02.2014
Размер:
1.2 Mб
Скачать

Необходимое условие экстремума функционала

Как мы знаем, для дифференцируемой функции нескольких переменных необходимым условием экстремума является равенство нулю всех частных производных (2.16) или полного дифференциала (2.17). Для функционалов частные производные не определены, а аналогом дифференциала является вариация.

Теорема 1 (необходимое условие экстремума функционала). Если варьируемый функционал J(y) достигает экстремума на y0(x) - "внутренней" функции области определения функционала, то вариация функционала на этой функции равна нулю: dJ(y0(x))=0.

Под внутренней функцией мы понимаем такую, которая не лежит на границе области определения, т.е. такую, для которой вариация может быть и положительной, и отрицательной.

Доказательство теоремы 1. Пусть функционал J(y(x)) достигает экстремума на y0(x) - "внутренней" функции области определения функционала. Выберем функцию h(x) настолько малой, чтобы при любых малых a функции вида V(a)=J(y0(x)+ah(x)) находились в области определения и при положительных, и при отрицательных a. Значению a=0 соответствует J(y0(x))=V(0) - экстремальное значение. Необходимое условие экстремума функции одной переменной V(a) - это равенство нулю её производной: V(0)=0. Но по (2.33-2.34) это соответствует тому, что равна нулю вариация функционала.

Замечание 1. Эта теорема также имеет место, если функционал зависит не от одной, а от нескольких функций. Для доказательства достаточно зафиксировать все функции, кроме одной, на экстремалях. Тогда функционал будет зависеть только от одной функции, и будет достигать экстремума, когда его вариация по этой функции будет равна нулю.

Замечание 2. Эта теорема также имеет место, если функционал зависит от функции нескольких переменных. В этом случае в классе функций (2.28) функции y0, y и h будут зависеть от нескольких переменных.

Основная лемма вариационного исчисления

Мы сейчас сформулируем и докажем одну простую лемму. Она играет настолько важную роль в вариационном исчислении, что так и называется: основная лемма вариационного исчисления. Дальше она будет использоваться при выводе дифференциальных уравнений Эйлера.

Лемма 1. Если h(x)Ck на [x1, x2] интеграл от произведения этой функции на другую функцию F(x)Ck по [x1, x2] равен нулю:

(2.35)

то это возможно только в том случае, если F(x)≡0 x [x1, x2].

Доказательство леммы 1. Проведём доказательство от противного. Пусть в какой-либо точке x0[x1, x2]: F(x0)≠0. Для определённости будем считать, что F(x0)=A>0. Вы когда-то изучали свойства функций, непрерывных на интервале, и знаете: если непрерывная функция в какой-то точке x0 отлична от нуля, то существует некоторая малая окрестность этой точки, в которой функция тоже отлична от нуля и имеет тот же знак, что и в точке x0. У нас F(x) Ck, т.е. является непрерывной. Поэтому наверняка существует некоторый интервал [x-, x+], в котором F(x0)>0.

Покажем теперь, как можно построить такую функцию h(x)Ck, что (2.35) будет нарушаться. Возьмём h(x) в виде:

(2.36)

За счёт показателя n можно добиться дифференцируемости нужное число раз, а за счёт k - сделать функцию сколь угодно большой или малой. Нарисуем с помощью MATLAB пример такой функции.

Тогда (2.35) будет нарушаться:

(2.37)

т.к. каждый из сомножителей под интегралом положительный. Аналогично, если в какой-либо точке F(x0)<0, то для этой же h(x) интеграл (2.37) будет отрицательный. Отсюда по принципу от противного следует, что, если (x) будет выполняться (2.35), то это возможно, только если F(x)є0.

Замечание 3. Основная лемма вариационного исчисления справедлива и для функции нескольких переменных. Сформулируем и докажем её для функции двух переменных. Формулируется она так: если (x,y)Ck в области D

(2.38)

то это возможно только в том случае, если F(x,y)≡0 (x,y)D.

Доказательство проводится так же, методом от противного. Предположим, что в какой-то точке (x0,y0)D: F(x0,y0)=A>0. Значит, существует некоторая малая d-окрестность точки (x0,y0), в которой F(x0,y0)>0. Построим функцию h(x,y) в виде:

(2.39)

Нарисуем трёхмерный график этой функции с помощью MATLAB. Посмотрите, как вычисляется функция z на заданной сетке. Мы проводим вычисления по первой части формулы (2.39), а затем умножаем поэлементно на булевский массив. При этом происходит автоматическое приведение типов, и булевский массив преобразуется в массив нулей и единиц. Т.о., в области D вычисления проводятся по первой части (2.39), а вне D будет 0.

Для этой функции h(x,y) условие (2.38) будет нарушаться: подынтегральная функция будет отлична от нуля (причём положительна) только в d-окрестности точки (x0,y0), поэтому интеграл (2.38) будет положительный. Аналогично, если в какой-то точке F(x0,y0)<0, то для подобранной нами h(x,y) интеграл (2.38) будет отрицательный. Следовательно, добиться выполнения (2.38) при произвольной h(x,y) можно, только если F(x,y)≡0.