Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Лосев-КлячинМиклюков МА в КИ

.pdf
Скачиваний:
864
Добавлен:
27.05.2015
Размер:
3.66 Mб
Скачать

§19. Достаточные условия локального экстремума

271

где θ [x0, x0 + ∆x] – некоторая точка, или, в развернутом виде,

1 n 2f

f(x0 + ∆x) − f(x0) = 2 i,j=1 ∂xi ∂xj (x0) dxidxj+

 

 

n

 

 

+

1

 

3f

(θ) dxidxjdxk.

 

6

i,j,k=1

∂xi ∂xj ∂xk

 

 

 

 

Напомним терминологию и некоторые факты из алгебры.

ОПРЕДЕЛЕНИЕ 19.1. Функция упорядоченной пары (x, y) точек n-мерного пространства вида

n

A(x, y) = A(x1, . . . , xn; y1, . . . , yn) = aijxiyj,

i,j=1

где aij – заданные числа, называется билинейной формой от x и y.

Величина A(x) = A(x, x) называется квадратичной формой, соответствующей билинейной форме A(x, y).

Обозначим через Qf (dx) квадратичную форму

n 2f

Qf (dx) = i,j=1 ∂xi ∂xj (x0) dxidxj.

Квадратичная форма Qf (dx) называется положительно

определенной (полуопределенной), если

для

любого

dx = (dx1, . . . , dxn) = 0 выполнено

Qf (dx)

> 0

(Qf (dx) 0) и отрицательно определенной (полуопределен-

ной), если

 

Qf (dx)

<

0

(Qf (dx)

 

0) при

всех

 

 

 

 

 

 

 

 

!

!

dx = (dx1, . . . , dxn) = 0. Если существуют векторы dx и dx

такие, что Q

(dx) < 0

, но

Q (dx) > 0

 

 

фор-

 

f

 

f

 

, то квадратичная

!

ма называется неопределенной!.

 

4

(или критерий

Известно

следующее правило Сильвестра

 

 

!

 

 

!

 

 

 

 

4Сильвестр Джемс Джозеф (3.9.1814-15.3.1897). Род. в Лондоне (Англия). Член Лондонского королевского общества (1841), иностранный член Петербургской АН (1872). Важнейшие работы относятся к алгебре, теории чисел, теории вероятностей, механике, математической физике.

272 Глава 12. Функции нескольких переменных

Сильвестра). Рассмотрим матрицу

 

 

 

 

2f

 

2f

 

 

2f

 

 

 

 

2

 

 

. . .

 

 

 

 

 

 

 

∂x ∂x

∂x12∂xn

=

∂x12

2 1 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

∂ f

 

∂ f

 

 

∂ f

 

 

2f

 

∂x2 ∂x1

 

∂x22 . . .

∂x2 ∂xn

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

2

 

 

 

2f

 

∂xi ∂xj

. . .

. . . . . .

. . .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

∂ f

 

∂ f . . .

 

2

 

 

 

 

 

 

 

 

 

 

 

 

∂xn ∂x1

 

∂xn ∂x2

∂xn

 

и обозначим через δk (k = 1, 2, . . . , n) ее главные миноры

 

 

 

 

 

 

 

2f

 

 

2f

 

 

 

 

 

 

 

 

2

 

 

∂x

 

 

δ1 = 2f ,

δ2

= det

 

∂x12

 

 

 

, . . . ,

 

 

∂x1 2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

∂ f

 

 

∂ f

 

 

 

 

∂x1

 

 

 

 

 

 

∂x22

 

 

 

 

 

 

∂x2 ∂x1

 

 

 

 

 

 

 

 

δn = det

 

2f

 

.

 

 

 

 

 

 

 

∂xi ∂xj

 

 

 

ТЕОРЕМА 19.1 (критерий Сильвестра). Для того чтобы квадратичная форма Qf (dx) была положительно определенной, необходимо и достаточно, чтобы

δ1 > 0, δ2 > 0, δ3 > 0, · · · , δn > 0.

Для того чтобы квадратичная форма Qf (dx) была отрицательно определенной, необходимо и достаточно, чтобы

δ1 < 0, δ2 > 0, δ3 < 0, · · · , (1)nδn > 0.

Докажем следующее достаточное условие для локального экстремума функции нескольких переменных.

ТЕОРЕМА 19.2. Пусть y = f(x) – трижды непрерывно дифференцируемая на открытом множестве D Rn функция и x0 D – ее критическая точка. Если в этой точке Qf (dx) > 0 (Qf (dx) < 0), то f имеет в x0 локальный минимум (максимум). Если Qf (dx) является в этой точке неопределенной квадратичной формой, то f не имеет в x0 локального экстремума.

Доказательство. В качестве первого шага оценим остаточ-

§19. Достаточные условия локального экстремума

273

ный член в тейлоровском разложении. Мы имеем

 

 

 

 

n

 

 

d3f(θ)

=

1

 

3f

(θ) dxidxjdxk , θ [x0, x0 +∆x].

 

 

 

 

 

 

3!

6

i,j,k=1

∂xi ∂xj ∂xk

 

 

 

 

 

 

Так как производные третьего порядка непрерывны, то найдутся постоянные A > 0 и ε > 0 такие, что

 

 

 

3f

∂xk

(x)

≤ A x , |x−x0| < ε и i, j, k = 1, . . . , n.

∂xi ∂xj

 

 

 

 

 

 

 

 

x

 

< ε, будем иметь

 

θ

 

 

x0

 

< ε и, сле-

Поэтому, выбирая

 

 

 

 

 

 

 

 

 

 

 

 

|

 

|

 

 

 

 

 

 

 

|

 

 

 

 

|

 

 

 

 

 

довательно,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

3f

 

(θ)dxidxjdxk

 

A

 

n

 

 

 

dxi

 

dxj

 

dxk

 

=

 

 

 

 

 

∂xk

i,j,k=1 |

 

| |

|

 

 

i,j,k=1 ∂xi ∂xj

 

 

 

 

 

 

 

 

 

| |

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

n

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

|dxi|

 

|dxj|

 

 

 

 

 

3/2

 

 

 

3

.

 

 

 

 

 

 

 

 

= A

 

j=1

|dxk| ≤ A n

 

 

|dx|

 

 

 

 

 

 

 

 

 

i=1

 

 

 

=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Здесь использовано следующее неравенство, получаемое с помощью неравенства Коши (докажите его!),

i=1 | | ≤

 

 

(

 

 

 

 

 

 

 

i=1

| |

n

 

 

 

n

 

 

 

 

 

(

 

 

 

 

 

 

 

)

 

 

 

 

 

dxi

n '

dxi2 = n dx .

Тем самым,

и

 

 

 

3!

 

6 |dx|3

 

 

d3f(θ)

 

 

 

An3/2

 

 

 

 

3

 

 

 

 

 

 

 

d f(θ)

2

 

 

 

 

 

 

 

3!

 

 

= o(|dx| ).

(1)

 

 

 

 

 

 

 

 

 

 

Сделаем второй шаг. Предположим, что квадратичная форма Qf (dx) > 0 в x0. Рассматривая ее как функцию перемен-

ной dx = (dx1, dx2, . . . , dxn) на единичной сфере |dx| = 1 и, пользуясь теоремой Вейерштрасса о достижимости точной нижней грани непрерывной функции на замкнутом ограниченном множестве, заключаем, что

Qf (dx) ≥ c > 0 для всех dx, |dx| = 1 ,

где

c = min Qf (dx).

|dx|=1

274 Глава 12. Функции нескольких переменных

Для произвольного dx мы имеем |dx/|dx|| = 1, а потому

 

|

 

|

n

 

 

|

| |

|

 

 

dx

 

2f

 

 

Qf (

 

dx

) = i,j=1

∂xi ∂xj

(x0)

 

dx

 

 

dx

 

≥ c ,

откуда

Qf (dx) = |dx|2 Qf (|dxdx|) ≥ c |dx|2.

Пользуясь тейлоровским разложением для ∆f(x0) и учитывая вид (1) остаточного члена, получаем

f(x0) = 12 Qf (dx) + o(|dx|2)

2c |dx|2 + o(|dx|2) = 2c |x|2 + o(|x|2) (∆x → 0).

Тем самым, для всех достаточно малых ∆x выполнено

f(x0 + ∆x) − f(x0) > 0

и x0 – точка локального минимума.

Шаг третий. Пусть Qf (dx) < 0 в точке x0. Тогда квадра-

тичная форма Q−f (dx), построенная для функции y = −f(x), является положительно определенной. Действительно, мы имеем

n

Q−f (dx) =

i,j=1

Поэтому функция

 

 

 

 

 

n

 

 

 

 

 

 

2(−f)

dx

dx

 

=

 

2f

dx

dx

 

=

 

 

 

 

 

∂xi ∂xj

i

 

j

 

i,j=1 ∂xi ∂xj

i

 

j

 

= −Qf (dx) > 0.

y = −f(x) имеет в x0 локальный минимум,

а функция y = f(x) – локальный максимум.

Нам осталось сделать последний — четвертый шаг и доказать последнее из высказываний теоремы. Итак, предположим, что квадратичная форма Qf (dx) не определена, т.е. существуют n-мерные векторы

x = (∆ x1, . . . , xn) и ∆ x = (∆ x1, . . . , xn)

такие, что

Qf (∆ x) > 0 и Qf (∆ x) < 0.

Рассмотрим функции вещественного переменного

g1(t) = f(x0 + tx) и g2(t) = f(x0 + tx).

При всех достаточно малых t точки x0 + tx и x0 + tx принадлежит множеству D, а потому функции g1(t) и g2(t)

§19. Достаточные условия локального экстремума

275

определены, по крайней мере, при достаточно малых t. По теореме о дифференцировании сложной функции эти функции трижды непрерывно дифференцируемы по t. Мы имеем

 

 

 

dg1

=

n

∂f

(x0 + tx) ∆ xk ,

 

 

 

 

 

 

 

 

 

 

 

dt

k

 

 

 

 

 

 

 

=1

∂xk

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

d

 

∂f

 

d g1

= k=1 xk

 

 

 

 

(x0 + tx) =

 

dt2

dt

∂xk

 

 

n

n

 

 

 

 

 

 

 

 

 

k

 

 

2f

 

 

 

 

= ∆ xk

 

 

 

 

 

 

 

(x0 + tx) ∆ xi =

 

 

=1

 

 

i=1

∂xi ∂xk

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

2f

+ tx) ∆ xixk.

=

 

 

 

 

 

(x0

 

 

 

 

 

 

 

 

 

 

∂xi ∂xk

 

 

 

 

 

 

 

i,k=1

 

 

 

 

 

 

 

 

 

Так как x0 – критическая точка, то

∂f

(x0) = 0 и

dg1

(0) = 0 ,

 

dt

∂xk

 

а

d2g21 (0) = Qf (∆ x) > 0. dt

Аналогичным образом, находим

dg2

(0) = 0 и

d2g2

(0) = Qf (∆ x) < 0.

dt

2

 

dt

 

Таким образом, функция g1(t) имеет при t = 0 локальный минимум, а g2(t) – локальный максимум. Отсюда заключаем,

что в любой окрестности точки x0 найдутся точки x0 + tx и x0 + tx такие, что

f(x0 + t1x) = g1(t1) > g1(0) = f(x0)

и

f(x0 + t2x) = g2(t2) < g2(0) = f(x0).

Тем самым, x0 не является точкой локального экстремума и теорема доказана.

УПРАЖНЕНИЕ 1. В каком месте рассуждений использована непрерывность производных третьего порядка?

УПРАЖНЕНИЕ 2. Проанализируйте доказательство теоремы. Нельзя ли доказать утверждение при более слабых предположениях относительно функции f?

276

Глава 12. Функции нескольких переменных

Отметим специальный случай доказанной выше теоремы для функций двух переменных.

СЛЕДСТВИЕ. Пусть z = f(x, y) – трижды непрерывно дифференцируемая функция, определенная на открытом множестве D R2. Пусть (x0, y0) D – ее критическая точка. Если в этой точке

fxxfyy − fxy2 > 0 ,

(2)

то z = f(x, y) имеет в ней локальный экстремум, а именно, локальный минимум при fxx > 0 и локальный максимум при fxx < 0. Если

fxxfyy − fxy2 < 0

(3)

в точке (x0, y0), то в этой точке экстремума нет.

Доказательство. Рассмотрим квадратичную форму

Qf (∆x, y) = fxxx2 + 2fxyx y + fyyy2.

Нетрудно видеть, что условие (2) влечет положительную определенность Qf (∆x, y) при fxx > 0 и ее отрицательную определенность при fxx < 0. При выполнении (3) эта квадратичная форма является неопределенной.

Необходимое утверждение следует тогда непосредственно из теоремы.

§20. Линии уровня функции двух переменных и их свойства

Пусть z = f(x, y) – функция двух переменных, непрерыв-

ная на открытом множестве D R2. Для произвольного вещественного числа t полагаем

Et = {(x, y) D : f(x, y) = t}.

Множество Et называется множеством t-уровня5 функции f.

ПРИМЕР 1. Найдем множества t-уровня функции z = x2 + y2. Имеем

Et = {(x, y) R2 : x2 + y2 = t}.

Если t < 0, то E = . Если t = 0, то E состоит из единствен-

t t

ной точки (0, 0). Если t > 0, то Et – окружность радиуса t.

5линией уровня

§20. Линии уровня функции двух переменных и их свойства

277

ПРИМЕР 2. Опишем множества t-уровня функции z = x2− y2. Имеем

Et = {(x, y) R2 : x2 − y2 = t}.

При t = 0 множество Et есть пара скрещивающихся прямых y = ±x.

При t < 0 имеем y2 = x2 − t, или y = ± x2 − t – пара гипербол.

При t > 0 имеем x2 = y2 + t

или

x =

±

y2 + t

– пара

гипербол.

 

 

ПРИМЕР 3. Рассмотрим функцию h(x, y), равную 1 при x2 + y2 1 и обращающуюся в 0 при x2 + y2 2. В точках кругового кольца 1 < x2 + y2 < 2 предполагается, что 0 < h(x, y) < 1. При этом можно добиться того, чтобы h была

сколь угодно гладкой во всей плоскости R2, например, дважды непрерывно дифференцируемой. (Подумайте, как можно построить такую функцию?)

278

Глава 12. Функции нескольких переменных

При t < 0 и t > 1 множества Et = . При t = 0 множество уровня

Et = {(x, y) R2 : x2 + y2 2}

есть внешность круга радиуса 2, при любых 0 < t < 1

множества t-уровня могут быть (но не обязательно) окруж-

ностями радиуса t, при t = 1 — единичный круг.

Вывод. Множество уровня Et может состоять из нескольких связных частей (компонент связности). Компоненты связности множества Et могут состоять из одной единственной точки, а также иметь внутренние точки или быть связными дугами и кривыми.

ТЕОРЕМА 20.1. Пусть D – открытое множество в

R2 и пусть z = f(x, y) – функция, непрерывная в D. Тогда всякое множество t-уровня этой функции является замкнутым.

Доказательство. Если Et = , то Et замкнуто по определению. Поэтому пусть Et = и пусть дана последовательность

точек (xn, yn) Et, (xn, yn) (x , y ). Требуется доказать, что (x , y ) Et, т.е. что f(x , y ) = t.

§20. Линии уровня функции двух переменных и их свойства

279

Действительно, это следует из непрерывности f в D, по-

скольку равенство f(xn, yn) = t влечет в данном случае, что f(x , y ) = t.

Пусть E R2 – множество и a = (x , y ) – его точка сгущения. Будем говорить, что прямая L, проходящая через точку a , является касательной к множеству E, если для любой последовательности точек

an = (xn, yn) E , an = a , an → a ,

последовательность прямых Ln, проходящих через

an = (xn, yn) и a = (x , y ), стремится к прямой L. Последнее означает, что угол между Ln и L стремится к нулю при

n → ∞.

РИСУНОК множества типа восьмерки, имеющего касательную в центре симметрии:

Ясно,6 что Ln → L тогда и только тогда, когда

 

/k, an

a

0

0 ,

(1)

 

 

an

a

 

 

 

 

|

 

|

 

 

 

где k – единичный вектор, ортогональный L.

6Ранее мы уже определяли пределы числовой последовательности и последовательности точек, пределы функции, пределы сумм Римана и Дарбу при неограни-

ченном измельчении разбиений. Все это, как и предел последовательности прямых, может быть описано в рамках единой общей конструкции — предела функции по фильтру. Мы не будем рассматривать здесь этот очень общий подход. Желающие

могут посмотреть его в книгах Н. Бурбаки, Общая топология. Основные структуры, 1968 (глава I, §7) или В.А. Зорича, Математический анализ, 2001 (глава III, §2).

|a − a0|

280

Глава 12. Функции нескольких переменных

ТЕОРЕМА 20.2. Пусть Et – множество t-уровня функции z = f(x, y) и (x0, y0) Et – некоторая точка. Предположим, что f имеет в окрестности точки (x0, y0) частные производные, непрерывные в (x0, y0). Тогда, если

f(x0, y0) = 0, то

i)точка (x0, y0) не может быть ни компонентой связности Et, ни внутренней точкой Et;

ii)множество Et имеет в (x0, y0) касательную и притом

перпендикулярную вектору f(x0, y0).

Доказательство. Утверждение i) очевидно. Если (x0, y0) – компонента связности множества Et, то f имеет в (x0, y0) локальный экстремум и потому f(x0, y0) = 0.

Если же (x0, y0) – внутренняя точка Et, то в некоторой ее окрестности f ≡ const, а потому f(x0, y0) = 0. В обоих случаях имеем противоречие.

Докажем утверждение ii). Поскольку f имеет частные производные в окрестности (x0, y0), непрерывные в (x0, y0), то она имеет в этой точке полный дифференциал и ее приращение в окрестности этой точки представимо в виде

 

 

 

∂f

 

 

 

 

 

 

 

∂f

 

f(x, y) − f(x0, y0) =

 

 

(x0, y0) (x − x0) +

 

 

 

(x0, y0) (y − y0)+

∂x

 

∂y

 

 

 

 

 

 

 

 

 

 

 

 

)

 

 

 

+o(

(x

x

)2 + (y

y

)2

 

при (x, y) (x0, y0).

 

 

0

 

 

 

0

 

 

 

 

Пусть (x, y) Et. Тогда имеем

 

 

 

 

 

 

 

 

∂f

 

 

 

 

 

 

∂f

 

 

 

 

 

 

 

 

 

(x0, y0) (x − x0) +

 

(x0

, y0) (y − y0) =

 

∂x

∂y

= o( (x − x0)2 + (y − y0)2).

Положим

a0 = (x0, y0) , a = (x, y).

В этих обозначениях предыдущее соотношение можно пере-

писать в виде

 

|

 

 

0|

 

= ε(|a − a0|) 0

/ f(x0

, y0), |a −a0|0

=

 

 

 

 

 

a

 

a

0

 

o(

a

 

 

a

 

)

 

 

 

 

 

при a → a0. Тем самым, из (1) следует, что множество Et имеет в точке a0 = (x0, y0) касательную и притом ортогональную вектору f(x0, y0). Теорема доказана.