Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2_sem_141

.pdf
Скачиваний:
16
Добавлен:
29.03.2016
Размер:
481.56 Кб
Скачать

Теорема 3.12.2. (достаточное условие локального экстремума). Пусть функция f определена в некоторой окрестности O(x0) точки x0;

f 2 C(2)(O(x0)) и точка x0 является критической точкой этой функции.

Если квадратичная форма

 

 

 

 

 

m

@2f

 

d2f(

 

 

 

 

X

 

 

 

 

 

 

 

 

 

 

 

0)(h) =

 

 

(

 

0)hihj

 

x

 

x

(20)

 

 

 

 

 

 

 

i;j=1

@xj@xi

 

 

 

 

 

 

 

 

 

 

 

1)знакоопределена, то в точке x0 функция имеет локальный экс- тремум, который является строгим локальным минимумом,если квадратичная форма положительно определена, и строгим локальным максимумом, если она отрицательно определена;

2)неопределена, то в точке x0 функция экстремума не имеет.

Доказательство. Согласно формуле Тейлора с остаточным членом в форме Пеано имеем равенство

2

f(x0 + h) f(x0) = X k1!dkhf(x0) + o(jhj2) =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 2

 

 

 

 

 

 

 

 

2

1

m

 

 

 

@2f

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

d

 

f(

 

0) + o(jhj ) =

 

 

 

 

 

 

 

 

 

 

 

 

 

(

 

 

 

0)hihj + o(jhj ) =

 

 

x

 

 

 

x

 

2

 

 

 

@xj@xi

2!

h

i;j=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

m

@2f

 

 

 

 

h

 

h

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

jhj2

i;j=1

 

 

 

 

 

(

x

0)

 

i

 

 

j

+ o(1) ;

2

@xj@xi

j

 

 

 

 

 

 

 

 

h

 

 

h

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

 

j j

 

 

j

где o(1) есть бесконечно малая функция при h ! 0:

Таким образом, знак разности f(x0 + h) f(x0) определяется знаком величины, стоящей в квадратных скобках.

Вектор

e = h1 ; : : : ; hm ; jhj jhj

очевидно, имеет единичную норму. Квадратичная форма (20) является непрерывной функцией. Следовательно, на единичной сфере

S(0; 1) = fh 2 Rm : jhj = 1g;

61

являющейся компактом, форма (20) принимает как наименьшее, так и наибольшее значение. Обозначим их через m и M соответственно.

Если квадратичная форма положительно определена, то 0 < m M;

и найдется число > 0; такое, что при jhj < будет jo(1)j < m: Тогда

при jhj < выражение в квадратных скобках окажется положительным

и, следовательно, f(x0 + h) f(x0) > 0: Таким образом, в этом случае точка x0 оказывается точкой строгого локального минимума функции f:

Аналогично проверяется, что в случае отрицаòельной определенности квадратичной формы функция имеет в точке x0 строгий локальный максимум.

Тем самым первый пункт заключения теоремы доказан. Докажем второе утверждение.

Если квадратичíàÿ ôорма не является определенной, то, очевидно, m < 0 < M: Пусть e1 è e2 - те точки единичной сферы, в которых

f(e1) = m; f(e2) = M:

Полагая h = te1; где t - достаточно мало, будем иметь

f(x0 + te1) f(x0) =

1 2

 

2t (m + o(1));

(21)

где o(1) ! при t ! 0: При достаточно малом t сумма m + o(1) будет иметь знак числа m; т.е. будет отрицательна. Тогда отрицательной будет

и левая часть равенства (21). Аналогично, полагая h = te2; получим

f(x0 + te2) f(x0) = 12t2(M + o(1));

и, следовательно, при всех достаточно малых значениях t разность f(x0 + te2) f(x0) будет положительна.

Очевидно, что в этом случае точка x0 не является точкой локального экстремума функции f:

62

Теорема 3.13.1.

3.13Теорема о неявной функции.

X 2 Rm; Y 2 R и уравнение

F : R

m+1

! R;

множества

Определение 3.32. Пусть даны функция

 

 

 

F (

 

 

 

 

 

(22)

x; y) = 0:

 

 

 

Если для каждого x 2 X существует единственное число y = f(x) 2 Y такое, что F (x; f(x)) = 0; то говорят, что уравнение (22) на множестве X Y определяет неявную функцию f : X ! Y:

Рассмотрим сначала случай m = 1:

(простейшая теорема о неявной функции). Если функция F; определенная в окрестности U точки (x0; y0); такова, что

1)F 2 C(1)(U); ( т.е. F непрерывно дифференцируема на U),

2)F (x0; y0) = 0;

3)Fy0(x0; y0) 6= 0;

то найдутся окрестности O(x0) è O(y0) такие, что на множестве O(x0) O(y0) уравнение (22) определяет непрерывно дифференцируемую функцию f : O(x0) ! O(y0): Причем для любого x 2 O(x0)

f0(x) = Fx0(x; f(x)): Fy0(x; f(x))

Доказательство. Пусть для определенности Fy0(x0; y0) > a > 0: Так как функция F непрерывно дифференцируема на U, то найдется круговая

окрестность O(x0; y0) точки (x0; y0) радиуса r; содержащаяся в U; такая, что для любой точки (x; y) 2 O(x0; y0) выполняются условия

Fy0(x; y) > a; Fx0(x; y) M;

(23)

где M - некоторая положительная константа. Пусть h = r=2:

Поскольку Fy0(x; y) > 0; то функция F (x0; y) от аргумента y возрастает на отрезке y0 h y y0 + h; следовательно,

F (x0; y0 h) < F (x0; y0) = 0 < F (x0; y0 + h):

63

В силу непрерывности функции F в O(x0; y0) найдется положительное < h такое, что при jx x0j будут выполнятся соотношения

F (x; y0 h) < 0 < F (x; y0 + h):

Покажем теперь, что интервалы (x0 ; x0 + ) è (y0 h; y0 + h) являются искомыми окрестностями O(x0) è O(y0):

При каждом фиксированном x 2 O(x0) рассмотрим отрезок с концами в точках (x; y0 h) è (x; y0 + h): Функция F (x; y) как функция от y непрерывна на этом отрезке, строго возрастает и принимает значения

разных знаков на концах. Следовательно, найдется единственная точка y 2 (y0 h; y0 + h) такая, что F (x; y) = 0: Обозначим y = f(x); тогда

F (x; f(x)) = 0:

Докажем теперь, что функция f непрерывна в точке x0: Пусть последовательность xn ! x0; причем все ее члены принадлежат O(x0) и отличны от x0: Пусть также yn = f(xn): Тогда

0 = F (xn; yn) F (x0; y0) = (F (xn; yn) F (x0; yn)) + (F (x0; yn) F (x0; y0)):

В силу теоремы Лагранжа найдется точка n; лежащая между точками x0 è xn; такая, что

F (xn; yn) F (x0; yn) = Fx0( n; yn)(xn x0):

Аналогично найдется точка n; лежащая между точками y0 è yn такая,

÷òî

F (x0; yn) F (x0; y0) = Fy0(x0; n)(yn y0):

Таким образом

Fx0( n; yn)(xn x0) + Fy0(x0; n)(yn y0) = 0:

В силу условий (23)

yn y0 = Fx00( n; yn)(xn x0) = O(1)o(1) = o(1); Fy(x0; n)

ò.å. yn ! y0: Это означает непрерывность функции f в точке x0: Поскольку n ! x0 è n ! y0; òî

 

 

 

 

yn

y0

n!1

 

F 0( n; yn)

 

 

F 0(x0; y0)

f0

(

 

0) = n!1

xn

x0

 

 

 

 

=

 

 

 

 

 

Fy0

(x0; n)

 

Fy0

(x0

; y0)

 

 

x

lim

 

 

= lim

 

x

 

 

 

 

x

 

 

:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

64

Определение 3.33.
Теорема 3.13.2.

Осталось заметить, что вместо точки (x0; y0) можно взять любую точ- ку (x; f(x)) 2 O(x0) O(y0) и провести аналогичные выкладки.

Таким образом для любого x 2 O(x0)

f0(x) = Fx0(x; f(x)): Fy0(x; f(x))

В силу теремы о напрерывности композиции из последнего равенства вытекает, что функция f0 непрерывна, т. е. функция f непрерывно диф-

ференцируема.

Теорема может быть обобщена на случай m > 1; т. е. случай, когда уравнение (22) определяет неявную функцию m переменных.

( теорема о неявной функции). Если функция F; определенная в окрестности U точки (x0; y0); такова, что

1)F 2 C(1)(U); ( т.е. F непрерывно дифференцируема на U),

2)F (x0; y0) = 0;

3)Fy0(x0; y0) 6= 0;

то найдутся окрестности O(x0) è O(y0) такие, что на множестве O(x0) O(y0) уравнение (22) определяет непрерывно дифференцируемую функцию f : O(x0) ! O(y0): Причем для любого x 2 O(x0) и любого

k = 1; : : : ; m

 

 

 

F 0 (

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x; f(x))

 

 

0

 

 

 

xk

 

(24)

 

 

 

(x) = Fy0(

 

 

 

 

 

 

 

 

 

fxk

 

 

 

 

:

 

x; f(x))

 

3.14 Дифференцируемость вектор-функций. Матрица Якоби и якобиан.

Вектор-функцию f = (f1; : : : ; fn) : Rm ! Rn íàçî- вем дифференцируемой в точке x0; если все функции fk; k = 1; : : : ; n; дифференцируемы в точке x0:

Вектор-функцию

df(x0) = (df1(x0); : : : ; dfn(x0))

будем называть дифференциалом функции f:

65

Матрица

Df(x0) =

0

:::1

 

 

 

 

 

 

 

@f1(

x

0)

 

 

 

 

 

B

@x

 

 

 

 

 

 

@x1

0

 

 

 

 

 

@

 

 

 

@fn(x )

1

:::@f1(x0) @xm

:::::: C

A

::: @fn(x0)

@xm

называется матрицей Якоби отображения f:

Введя вектор dx = (dx1; : : : ; dxm); можно записать в матричном виде

df(x0) = Df(x0)dx:

Если n = m; то определитель матрицы Якоби называют якобианом

и обозначают через

D(f1; : : : ; fm) (x0): D(x1; : : : ; xm)

Опредåление 3.34. Матрица Якоби называется производной отображения f в точке x0 и обозначается через f0(x0):

Теорема 3.14.1. (о производной композиции отобðажений). Пусть отображение f : Rm ! Rn дифференцируемо в точке x0; являющейся внут-

ренней точкой области определения функции f; а отображение

g : Rp ! Rm дифференцируемо в точке t0; являющейся внутренней точ-

кой области определения функции g; и x0 = g(t0): Тогда композиция f g

дифференцируема в точке t0 и справедлива формула

 

 

 

 

)0(

 

0) =

 

0(

 

0)

 

0(

 

0):

 

(

f

f

 

 

t

t

(25)

g

x

g

Доказательство. Равенство (25) представляет собой матричную форму записи системы равенств

@(fk

 

)

 

m

@fk

(

 

0)

@gi

(

 

0) (k = 1; : : : ; n; j = 1; : : : ; p);

g

(

t

0) =

 

t

 

x

 

 

 

Xi

 

@tj

 

 

 

@tj

=1

@xi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

справедливых в силу теоремы (3.9.1) о производной сложной функции.

Теперь можно рассмотреть общий случай теоремы о неявной функции.

Пусть x = (x1; : : : ; xm); y = (y1; : : : ; yn); а функция F = (F1; : : : ; Fn) : Rm+n ! Rn:

66

Тогда уравнение

F (

 

 

 

 

(26)

x; y) = 0

представляет собой систему уравнений

8

> F1(x1; : : : ; xm; y1; : : : ; yn) = 0;

<

:::::::::::::::::::::::::::::::::::::::::::::::

>

: Fn(x1; : : : ; xm; y1; : : : ; yn) = 0:

Если для каждого x 2 X (X Rm) существует единственный вектор y = f(x) 2 Y (Y Rn) такой, что F (x; f(x)) = 0; то говорят, что уравнение (26) на множестве X Y определяет неявную функцию f : X ! Y:

Согласно данным ранее определениям

 

 

f0(x) =

0

:::1

 

 

 

 

 

:::

:::

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

@f1(

x

)

 

 

 

:::

 

@f1(

x

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

B

@x

 

@xm

C

 

 

 

 

 

 

 

 

@x1

:::

 

@xm ;

 

 

 

 

 

 

 

 

@

@fn(

 

 

 

)

 

 

 

 

@fn(

 

 

)

 

 

 

 

 

A

 

 

 

 

 

 

 

 

 

x

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

F x0 (x; y) =

0

:::1

 

 

 

 

 

:::

:::

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

@F1(

x;y)

:::

 

 

 

@F1(

x;y)

 

 

 

 

 

 

 

 

 

 

@x

 

 

 

 

@xm

 

 

 

 

 

 

 

 

 

 

 

 

 

@

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

B

@Fn(

 

 

 

 

 

 

 

 

 

@Fn(

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x;y)

:::

 

x;y)

;

F y0 (x; y) =

@x1

 

 

 

@xm

 

 

 

 

0

:::1

 

 

 

 

 

:::

 

 

 

 

 

:::n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

@F1(

x;y)

:::

 

 

 

@F1(

x;y)

 

 

 

 

 

 

 

 

 

 

@y

 

 

 

 

 

 

@y

 

 

 

 

 

 

 

 

 

 

 

 

 

@

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

B

@Fn(

 

 

 

 

 

 

@Fn(

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x;y)

:::

 

x;y)

;

 

 

 

 

 

 

 

 

@y1

 

 

 

 

@yn

 

 

 

 

1

C

A

1

C

A

Заметим, что последняя матрица квадратная. Она обратима тогда и только тогда, когда ее определитель отличен от нуля, то есть

D(F1; : : : ; Fn)(x; y) 6= 0:

D(y1; : : : ; yn)

Матрицу, обратную к F 0y(x; y); будем, как обычно, обозначать символом

F 0y(x; y) 1:

Теорема 3.14.2. (о неявной функции). Если отображение F ; определенное в некоторой окрестности U точки (x0; y0) таково, что

1) F 2 C(1)(U) (т. е. непрерывно дифференцируемо на U),

67

2)

F (

x

0;

y

0) = 0;

 

 

 

 

 

 

 

 

 

 

 

 

 

D(F1

;:::;Fn)

 

 

 

 

 

(т.е. матрица

 

 

0

 

 

 

 

 

обратима),

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3)

 

(x0; y0) 6= 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D(y1

;:::;yn)

 

F y

(x0; y0)

 

то найдутся окрестности O(x0) è O(y0) такие, что на множестве O(x0) O(y0) уравнение F (x; y) = 0 определяет непрерывно дифференцируемую вектор-функцию f : O(x0) ! O(y0): Причем для любого x 2 O(x0) матрица Якоби для отображения f может быть вычислена по

формуле

0 0 1 0

f (x) = F y(x; f(x)) [F x(x; f(x))]:

3.15Условный экстремум. Метод Лагранжа.

Ранее мы изучали вопрос отыскания локальных экстремумов функций, аргументы которых не связаны никакими дополнительными условиями. Однако, в математике и ее приложениях часто встречаются зада- чи отыскания экстремумов функций, аргументы которых удовлетворяют дополнительным условиям связи. Экстремумы такого рода называют

условными.

Определение 3.35. Пусть функции f; gi(i = 1; : : : ; r); являющиеся отображениями из Rm в R; определены в некоторой окрестности точки x0

è gi(x0) = 0: Значение f(x0) называется условным максимумом (минимумом) функции f при условиях связи gi(x) = 0; i = 1; : : : ; r; если существует такая окрестность O(x0); ÷òî f(x0) является наибольшим (наименьшим) значением сужения функции на множество

\

O(x0) fx 2 Rm : gi(x) = 0; i = 1; : : : ; rg:

Рассмотрим частный случай, когда r = 1; т. е. условный экстремум с одним уравнением связи.

Теорема 3.15.1. (теорема Лагранжа). Пусть функции f и g непрерыв-

но дифференцируемы в некоторой окрестности точки x0; g(x0) = 0 и вектор-градиент grad g(x0) 6= 0: Если функция f имеет условный экстремум в точке x0 с условием g(x) = 0; то существует такое число2 R; что

grad(f g)(x0) = 0:

68

Доказательство. Не ограничивая общности, будем считать, что

@g(x0) 6= 0: @xm

Выберем такое число 2 R; чтобы выполнялось равенство

@f(x0) @g(x0) = 0: @xm @xm

Очевидно, что такой выбор возможен. Для доказательства теоремы остается убедится в том, что

@f(x0) @g(x0) = 0 @xi @xi

ïðè âñåõ i = 1; : : : ; m 1:

По теореме о неявной функции существуют такие окрестности

O(x01; : : : ; x0m 1) è O(x0m); что уравнение g(x) = 0 определяет неявную дифференцируемую функцию ' : O(x01; : : : ; x0m 1) ! O(x0m): В окрестности O(x01; : : : ; x0m 1) рассмотрим функцию

F (x1; : : : ; xm 1) = f(x1; : : : ; xm 1; '(x1; : : : ; xm 1)):

Из определения условного экстремума следует, что функция

F имеет

локальный экстремум в точке (x0; : : : ; x0

 

 

 

 

): Согласно теореме Ферма,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

m 1

 

 

 

 

 

 

 

 

 

 

 

при любом i = 1; : : : ; m 1 имеем равенства

 

 

 

 

 

@F (x0

; : : : ; x0

 

 

)

 

 

@f(

 

 

0)

 

 

 

@f(

 

0) @'(x0; : : : ; x0

)

 

 

 

x

 

 

 

x

0 =

1

 

 

 

 

m 1

 

 

=

 

 

 

 

 

 

 

 

 

+

 

 

 

 

 

 

 

 

1

 

m 1

 

=

 

 

 

 

 

 

 

@xi

 

@xm

 

 

 

 

@xi

 

 

 

 

 

 

 

 

 

 

 

 

 

@xi

 

 

 

 

 

@f(

 

 

0)

 

 

 

@g(

 

0) @'(x0

; : : : ; x0

)

 

 

 

 

 

x

x

 

 

 

 

=

 

 

 

 

 

 

 

 

 

+

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

m 1

 

:

 

 

 

 

 

@xi

 

 

 

 

 

@xm

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

@xi

 

 

 

 

По теореме о неявной функции при всех i = 1; : : : ; m 1

 

 

 

 

@g(

 

0)

 

 

@'(x0; : : : ; x0

 

 

)

 

 

 

 

 

 

 

@g(

 

0)

 

 

 

 

x

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

m 1

 

 

=

 

 

:

 

 

 

 

 

@xm

 

 

 

 

 

 

 

@xi

 

 

 

@xi

 

 

 

Следовательно,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

@f(

 

0)

 

 

 

 

 

@g(

 

0)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

x

= 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

@xi

 

 

 

 

@xi

 

 

 

 

 

 

 

 

 

 

ïðè âñåõ i = 1; : : : ; m 1:

69

Доказанная теорема лежит в основе метода нахождения условного экстремума, который называют методом множителей Лагранжа. Строят функцию

F (x; ) = f(x) g(x):

Для нахождения точки x0 возможного условного экстремума надо решить систему уравнений:

(

@F (

 

 

 

 

x; )

= 0 (i = 1; : : : ; m);

@xi

 

 

 

@F (

 

 

 

 

 

x; )

= 0 (g(

 

) = 0):

x

@

 

 

 

Для получения достаточного условия экстремума в точке x0 у функции f при наличии связи g(x) = 0 следует присоединить к системе требование знакоопределенности в этой точке d2F: В соответствии с ранее

полученными результатами можно констатировать наличие в точке x0 минимума, если при наличии связи g(x) = 0 d2F (x0) > 0; и максимума, если d2F (x0) < 0:

В случае нескольких уравнений связи gj(x) = 0; j = 1; : : : ; r; следует построить функцию Лагранжа

r

X

F (x; ) = f(x) jgj(x);

j=1

и далее поступать аналогично.

70