Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Metody_optimizatsii.doc
Скачиваний:
57
Добавлен:
16.02.2016
Размер:
1.15 Mб
Скачать

Экстремум функционала

Теперь мы по аналогии с определением 4 можем дать определение точки экстремума функционала. Конечно, такой точкой будет функция.

Определение 13. Функция y0(x) называется точкой минимума функционала J(y(x)), если y(x) из её малой d-окрестности выполняется условие: J(y(x))іJ(y0(x)). Если при этом y(x) из этой d-окрестности, кроме y0(x), будет J(y(x))>J(y0(x)), то говорят, что на функции y0(x) достигается строгий минимум. Аналогично даётся определение максимума (строгого максимума) функционала.

Посмотрите внимательно на это определение: в нём участвует d-окрестность функции, а мы определяли d-окрестность для конкретного класса функций. Вот в соответствии с этим классом и говорят об экстремуме функционала в C0, C1, ..., Ck.

Определение 14. Функция y0(x) называется точкой экстремума k-го порядка функционала J(y(x)), если соответствующее условие из определения 13 выполняется в d-окрестности функции y0(x) в Ck.

Пусть на функции y0(x) достигается экстремум k-го порядка. Какой вывод мы тогда можем сделать из этого: что достигается экстремум (k-1)-го или (k+1)-го порядка? Давайте разберёмся в этом вопросе. Если, например, на y0(x) достигается минимум k-го порядка, то y(x), которые мало отличаются от y0(x) по значениям функции, значениям 1-й производной, значениям 2-й производной, и т.д., значениям k-й производной, будет выполняться J(y(x))іJ(y0(x)). Если при этом, кроме того, y(x) будет мало отличаться от y0(x) ещё и по значениям (k+1)-й производной, то хуже от этого не будет: другие условия малого отличия не нарушаются, появляется новое, дополнительное условие. Поэтому по-прежнему будет выполняться J(y(x))іJ(y0(x)). Если же, наоборот, значения k-х производных отличаются значительно, то может уже оказаться, что условие J(y(x))іJ(y0(x)) не выполняется. Таким образом, мы должны здесь применить вывод 1'.

Вывод 3. Если на функции y0(x) достигается экстремум k-го порядка, то будет достигаться и экстремум (k+1)-го порядка.

Определение 15. Экстремум 0-го порядка называется сильным. Экстремум 1-го порядка называется слабым (или слабым 1-го порядка). Экстремум k-го порядка называется слабым экстремумом k-го порядка.

Если на какой-то функции достигается сильный экстремум, то достигается и слабый (любого порядка). Если на какой-то функции достигается слабый экстремум меньшего порядка, то достигается и слабый экстремум большего порядка.

Непрерывность и варьируемость функционала

Как же исследовать функционал на экстремум? Для этого нужны условия: необходимые - чтобы найти функции, на которых может достигаться экстремум, и достаточные, чтобы проверить: достигается ли экстремум. Для вывода этих условий вновь обратимся к функции n переменных (2.5). Мы знаем, что необходимым условием экстремума такой функции является равенство нулю всех частных производных:

(2.16)

или, что то же самое, равенство нулю полного дифференциала:

(2.17)

Разумеется, функция y(x) при этом должна быть дифференцируемой: её приращение в точке Dy должно быть представимо в виде суммы двух слагаемых: линейного относительно вектора малых приращений dx и бесконечно малой величины высшего порядка малости относительно |dx|:

(2.18)

Здесь C - вектор постоянных величин (частные производные в точке), b - бесконечно малая величина.

Для того, чтобы мы вообще могли говорить о дифференцируемости, наша функция y(x) обязательно должна быть непрерывной: бесконечно малому приращению аргументов dx должно соответствовать бесконечно малое приращение функции.

Давайте теперь разбираться с функционалами. Введём понятие, аналогичное понятию дифференциала аргумента, и дадим определение непрерывности функционала.

Определение 16. Вариацией (или приращением) функции y(x) на функции y0(x) называется:

(2.19)

Вариация называется малой в смысле малости k-го порядка, если её норма в классе Ck мала, т.е. не превышает сколь угодно малого заданного наперёд числа h:

(2.20)

Это - аналог бесконечно малого приращения аргумента функции нескольких переменных (дифференциала аргумента). Если вариация dy - малая k-го порядка, то функции y(x) и y0(x) и сами отличаются мало, и их производные до k-го порядка включительно также отличаются мало. Однако производные более высокого, например, (k+1)-го порядка порядка, могут уже отличаться значительно. Согласно выводу 2' мы можем утверждать:

Вывод 4. Если вариация dy - малая k-го порядка порядка, то она будет малой и (k-1)-го порядка.

Из (2.19) следует, что операции варьирования и дифференцирования переставимы. Поэтому, когда мы будем писать dy(k), то это означает и d(y(k)), и (dy)(k).

Вариация функции dy вызывает приращение функционала J.

Определение 17. Приращением функционала J на функции y0(x), соответствующим вариации функции dy, называется:

(2.21)

Будет ли приращение функционала ΔJ малым, если вариация функции - малая? Если да, то мы может сказать, что наш функционал - непрерывный. Дадим точное определение непрерывности.

Определение 18. Функционал J(y(x)) называется непрерывным на функции y0(x) в смысле непрерывности k-го порядка, если малой (в смысле малости k-го порядка) вариации функции dy соответствует малое приращение функционала J(y). Или: функционал J(y(x)) называется непрерывным на функции y0(x) в смысле непрерывности k-го порядка, если для любого сколь угодно малого заданного наперёд положительного числа e существует такое малое число h, что, как только мы сделаем норму вариации функции dy (в смысле Ck) меньше h, так сразу модуль приращения функционала станет меньше e.

У Вас не возникает ощущения, что Вы где-то уже это слышали? Конечно, это обычное определение предела. В нашем случае он выглядит так:

(2.22)

Здесь норма вариации функции ||dy|| вычисляется в Ck.

Что следует из непрерывности k-го порядка: непрерывность (k-1)-го порядка или (k+1)-го? Как всегда, давайте анализировать. Пусть, например, наш функционал непрерывен в смысле 1-го порядка. Приращение функционала стремится к нулю, когда максимальная из двух величин: max|dy| и max|dy'| стремится к нулю. Если при этом ещё и max|dy''|→0, то хуже от этого не будет: всё равно будет ΔJ→0. А вот если отказаться, например, от требования max|dy'|→0, то оставшегося условия max|dy|→0 может уже оказаться недостаточно для того, чтобы ΔJ→0.

Вывод 5. Если функционал J непрерывен в смысле непрерывности k-го порядка, то он будет непрерывен и в смысле непрерывности (k+1)-го порядка.

С непрерывностью мы разобрались. Далее введём понятие, аналогичное дифференцируемости. Нам нужно будет выделять из приращения функционала главную, линейную часть. Но записать её так, как в (2.18) эта часть записана для функции, мы не можем: у нас нет понятия скалярного произведения. Поэтому введём понятие линейного функционала, а затем используем его в определении варьируемости (это аналог дифференцируемости).

Определение 19. Функционал L(y) называется линейным, если:

(2.23)

Пример линейного функционала:

(2.24)

Определение 20. Функционал J(y) называется варьируемым на функции y(x), если его приращение на этой функции ΔJ, соответствующее вариации функции dy, можно представить в виде суммы двух слагаемых:

  1. линейного относительно dyфункционалаL(y,dy) (этот функционал зависит ещё и отy- той функции, в окрестности которой вычисляется приращение);

  2. бесконечно малого функционала высшего порядка малости по сравнению с dy(мы его можем представить как произведение просто бесконечно малого относительно dyфункционала b(y,dy) на ||dy||):

(2.25)

Здесь b(y,dy) - бесконечно малый относительно dy функционал:

(2.26)

В определении варьируемости участвует норма вариации функции, поэтому мы должны рассматривать варьируемость в конкретном классе функций, т.е. говорить о варьируемости 0-го, 1-го, ..., k-го порядка. Согласно выводу 1', если функционал варьируемый для всех функций из какого-либо класса, то он будет варьируемым и для всех функций из подкласса этого класса.

Вывод 6. Если функционал J варьируемый в Ck, то он будет варьируемым и в Ck+1.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]