Лосев-КлячинМиклюков МА в КИ
.pdf§13. Полный дифференциал сложной функции |
261 |
ТЕОРЕМА 12.2. Предположим, что функция f(x, y, z) имеет в точке (x0, y0, z0) непрерывные частные производные, а функции x = x(u, v), y = y(u, v), z = z(u, v) – непрерывные частные производные в точке (u0, v0), где
x0 = x(u0, v0) , y0 = y(u0, v0) , z0 = z(u0, v0).
Если сложная функция Φ(u, v) = f(x(u, v), y(u, v), z(u, v)) определена в окрестности точки (u0, v0), то она имеет в этой точке частные производные, причем
|
|
|
|
|
∂Φ |
(u0, v0) = |
∂f |
|
(x0, y0, z0) |
∂x |
(u0, v0)+ |
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
∂u |
∂x |
∂u |
|
|||||||||||||||||
|
∂f |
|
|
|
|
∂y |
|
|
|
∂f |
|
|
|
|
|
∂z |
|
||||||||
+ |
|
|
|
(x0, y0, z0) |
|
|
|
(u0, v0) + |
|
|
|
(x0, y0, z0) |
|
|
(u0, v0) |
||||||||||
|
∂y |
∂u |
|
∂z |
∂u |
||||||||||||||||||||
и |
|
|
|
|
∂Φ |
|
|
|
|
|
∂f |
|
|
|
|
|
|
∂x |
|
|
|
|
|
|
|
|
|
|
|
|
(u0, v0) = |
|
(x0, y0, z0) |
(u0, v0)+ |
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
∂v |
∂x |
|
∂v |
|
||||||||||||||||
|
∂f |
|
|
|
∂y |
|
|
|
∂f |
|
|
|
|
∂z |
|
||||||||||
+ |
|
|
(x0, y0, z0) |
|
(u0, v0) + |
|
|
(x0, y0, z0) |
|
(u0 |
, v0). |
||||||||||||||
∂y |
∂v |
∂z |
∂v |
УПРАЖНЕНИЕ 1. В каком месте доказательства используется предположение о непрерывности частных производных в точке ?
УПРАЖНЕНИЕ 2. Сформулировать и доказать приведенные выше теоремы для функций n переменных.
УПРАЖНЕНИЕ 3. Попробуйте привести более "сжатое" доказательство теоремы 12.1.
§13. Полный дифференциал сложной функции. Инвариантность формы первого дифференциала
Предположим, что задана дифференцируемая функция
u = f(x1, x2, . . . , xn) , где xi = xi(t1, t2, . . . , tk) −
также дифференцируемые функции k переменных. Ее полный дифференциал подсчитывается по формуле
|
i |
|
||
du = |
k |
∂u |
dti. |
(1) |
|
=1 |
∂ti |
|
|
|
|
|
|
262 |
Глава 12. Функции нескольких переменных |
Заметим, однако, что, пользуясь правилом вычисления частной производной сложной функции, имеем
|
|
|
∂u |
j |
∂f ∂xj |
|
|
|
|
|
|
|
|
|||||||
|
|
|
n |
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
= |
|
|
|
|
|
|
. |
|
|
|
|
|
|
|
|
|
|
∂t |
|
∂x |
j |
|
∂t |
i |
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
i |
=1 |
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Отсюда, учитывая (1), находим |
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
dxj |
|
|
||
du = |
|
∂xj |
|
∂ti |
dti |
= |
|
|
|
∂xj |
% |
|
|
|
|
$i = |
||||
|
|
|
|
|
k |
|
|
dt |
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
i |
|
|
|
|
|
|||
k |
n |
∂f |
|
∂xj |
|
|
|
|
n |
|
∂f |
|
|
∂xj |
|
|
||||
i=1 j=1 |
|
|
|
|
|
|
|
j=1 |
|
=1 |
|
∂ti |
|
|
||||||
|
|
|
|
|
|
|
|
|
|
j |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
∂f |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
= |
=1 |
∂xj |
dxj , |
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
т.е. |
|
|
|
|
|
|
j |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
du = |
n |
∂f |
dxj. |
|
|
|
|
|
(2) |
||||||||
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
=1 |
∂xj |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Вывод. Дифференциал сложной функции всегда можно вычислять по формуле (2) независимо от того являются ли xj функциями переменных t1, t2, . . . , tk либо независимыми переменными.
Данное свойство описывает инвариантность формы первого дифференциала функции нескольких переменных.
§14. Дифференциалы высшего порядка
Предположим, что на открытом множестве D Rn за-
дана некоторая функция f(x) = f(x1, x2, . . . , xn), имеющая непрерывные частные производные. Тогда, как нам известно,
существует полный дифференциал
n ∂f
df = i=1 ∂xi (x1, x2, . . . , xn) dxi.
Данная величина (если зафиксировать dxi = ∆xi) является функцией переменной x = (x1, x2, . . . , xn) D и мы можем
ставить вопрос о ее дифференциале. Так, если функции ∂f
∂xi
имеют непрерывные частные производные или, что то же самое, функция f имеет на D непрерывные вторые производ-
264 |
Глава 12. Функции нескольких переменных |
т.е. однородная функция нулевой степени представляется в виде функции отношений всех аргументов к одному из них.
Пусть теперь f(x, y, z) однородна степени s. Тогда функция f(x, y, z)/xs является однородной степени 0, а потому
f |
( |
x, y, z |
) |
= f˜ |
y |
, |
z |
. |
|
|
|
|
|
||||||
|
|
xs |
|
|
x |
x |
Тем самым, приходим к общему виду однородной функции
степени s |
f(x, y, z) = xs f˜ |
y |
|
z |
. |
|
, |
||||
|
|
|
|||
|
x |
x |
Предположим, что однородная степени s функция f(x, y, z) имеет непрерывные частные производные по каждой из переменных. Продифференцируем обе части равенства (1) по переменной t. Мы имеем
fx(tx, ty, tz)x + fy(tx, ty, tz)y + fz(tx, ty, tz)z = sts−1f(x, y, z).
В частности, при t = 1 приходим к формуле Эйлера fx(x, y, z) x + fy(x, y, z) y + fz(x, y, z) z = s f(x, y, z).
Можно показать, что всякая функция, имеющая непрерывные частные производные и удовлетворяющая формуле Эйлера, является однородной функцией степени s (Г.М. Фихтенгольц, Курс дифференциального и интегрального исчисления, раздел 188).
УПРАЖНЕНИЕ 1. Указать области определения однородных функций. Могут ли эти области быть произвольными?
УПРАЖНЕНИЕ 2. Привести примеры недифференцируемых однородных функций степени s > 1.
§16. Производная по направлению и градиент
Пусть z = f(x, y) – функция, определенная на открытом множестве D R2. Пусть (x0, y0) D – некоторая точка и пусть e = (cos α, sin α) – единичный вектор, задающий направление в точке (x0, y0). Уравнение прямой, проходящей через точку (x0, y0) в направлении e имеют вид
x(t) = x0 + t cos α , y(t) = y0 + t sin α.
Сужение функции f на эту прямую есть функция переменной t, описываемая равенством z = f(x(t), y(t)) или, что то же самое,
z = f(x0 + t cos α , y0 + t sin α).
§16. Производная по направлению и градиент |
265 |
Данная функция определена, по крайней мере, для достаточно малых t, поэтому можно ставить вопрос о ее производной при t = 0. Эта производная называется производной по направлению e функции двух переменных f в точке (x0, y0) и обозначается
∂f
∂e (x0, y0).
Как следует из правила дифференцирования сложной функции, если f имеет в D непрерывные частные производные, то для производной по направлению e справедлива следующая формула
∂f |
dz |
|
∂f |
|
∂f |
|
(1) |
||
|
|
(x0, y0) ≡ |
|
(0) = |
|
(x0, y0) cos α + |
|
(x0, y0) sin α. |
|
|
|
dt |
∂x |
∂y |
|||||
∂e |
Градиентом функции f в точке (x0, y0) называется вектор
f(x0, y0) ≡ |
∂f |
(x0, y0), |
∂f |
(x0, y0) |
≡ grad f(x0, y0). |
|
|
||||
∂x |
∂y |
Если воспользоваться этим символом, то формула (1) переписывается в следующем виде
∂f |
(x0, y0) = f(x0, y0), e . |
(2) |
∂e |
Из определения производной по направлению следует, что она описывает скорость роста функции в точке (x0, y0) в направлении вектора e. Выясним геометрический смысл градиента.
Предположим, что точка (x0, y0) D не является критической, т.е. выполнено f(x0, y0) = 0. Соотношение (2) влечет, что
∂f
∂e (x0, y0) = | f(x0, y0)| · |e| · cos θ = | f(x0, y0)| cos θ ,
где θ – угол между векторами e и f(x0, y0). Поэтому минимальное и максимальное значения производной ∂f∂e (x0, y0) достигаются, соответственно, при θ = 0 и θ = π, т.е. при
|
|
= |
f(x0, y0) |
и |
|
= |
− |
f(x0, y0) |
. |
|
e |
e |
|||||||
|
| f(x0, y0)| |
| f(x0, y0)| |
|||||||
|
|
|
|
|
|
Вывод. Градиент функции в некритической точке (x0, y0)
– это вектор, направление которого указывает направление наибольшего подъема функции в этой точке, а длина равна абсолютной величине производной по этому направлению.
266 |
Глава 12. Функции нескольких переменных |
Аналогичным образом определяются производная по направлению и градиент функции большего числа переменных.
Пусть z = f(x1, x2, . . . , xn) и a = (a1, a2, . . . , an). Тогда, по определению,
|
|
f(a) = |
|
∂f |
|
∂f |
∂f |
|
|||||
|
|
|
|
|
(a), |
|
(a), . . . , |
|
(a) |
||||
∂x1 |
∂x2 |
∂xn |
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
cos2 αi = 1, то |
и, если, |
e |
= (cos α1, cos α2 |
, . . . , cos αn), где |
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
=1 |
|
|
|
∂f |
|
f(a), |
|
. |
|
|
|||||
|
|
|
|
|
|
(a) = |
e |
|
|
||||
|
|
|
|
|
|
|
|||||||
|
|
|
∂e |
|
|
|
ПРИМЕР 1. Найдем направление наибольшего подъема функции
z = x2 − y2
2
вточке (1, 1) и производную в этом направлении. Для градиента функции в точке (1, 1) имеем
z(1, 1) = |
∂z |
(1, 1), |
∂z |
(1, 1) = (2, −1) |
= 0. |
|
|
||||
∂x |
∂y |
Находим направление наибольшего подъема
|
|
z(1, 1) |
|
= |
2 |
|
1 |
||
|
= |
|
|
√5 |
, −√5 |
||||
e |
|
||||||||
z(1, 1) |
|
||||||||
|
|
| |
| |
|
|
|
|
|
|
и, далее, производную в этом направлении
∂z |
|
/ z(1, 1), |
z(1, 1) |
|
0 |
|
|
|
|
|
|
= |z(1, 1)| = √5. |
|||||||
|
|
(1, 1) = |
|
|
|||||
∂e |
z(1, 1) |
|
|||||||
|
|
|
|
| |
| |
|
|
|
|
§17. Формула Тейлора для функций нескольких переменных |
267 |
§17. Формула Тейлора для функций нескольких переменных
ТЕОРЕМА 17.1. Пусть y = f(x) = f(x1, . . . , xn) –
функция, определенная в области D Rn и имеющая там непрерывные частные производные вплоть до порядка (N +1) включительно. Пусть точки x0 = (x01, . . . , x0n)
и x0 + ∆x = (x01 + ∆x1, . . . , x0n + ∆xn) и соединяющий их отрезок [x0, x0 + ∆x] принадлежат D. Тогда существует
точка θ [x0, x0 + ∆x] такая, что
∆f(x0) = N d(k)f(x0) + d(N+1)f(θ). k!
k=1
Доказательство. Введем новую переменную t [0, 1], и пусть
x1 = x01 + t ∆x1
x = x0 + t ∆x = . . . . . .
xn = x0n + t ∆xn.
При изменении параметра t в пределах отрезка [0, 1] точка x = x0 + t ∆x движется вдоль отрезка [x0, x0 + ∆x].
Рассмотрим сложную функцию y = F (t) = f(x0 + t ∆x), где t [0, 1]. Данная функция имеет непрерывные производные вплоть до порядка N + 1 включительно и, на основании формулы Тейлора для одномерного случая, имеем
F (1) − F (0) = N F (k)(0) + F (N+1)(ξ) , k! (N + 1)!
k=1
где ξ [0, 1].
Пользуясь формулой для вычисления частных производ-
ных от сложной функции, получаем |
|
|
||||||
F (1)(t) = |
n |
∂f |
(x0 + t ∆x) |
dxi |
= |
n |
∂f |
(x0 + t ∆x) ∆xi , |
|
|
|
|
|||||
|
i |
|
dt |
∂xi |
||||
|
=1 |
∂xi |
|
i=1 |
||||
|
|
|
|
|
|
|
§18. Необходимые условия локального экстремума |
269 |
§18. Необходимые условия локального экстремума функции нескольких переменных
Пусть y = f(x) = f(x1, x2, . . . , xn) – функция, определенная на открытом множестве D Rn. Пусть
x0 = (x01, x02, . . . , x0n) – точка в D.
ОПРЕДЕЛЕНИЕ 18.1. Говорят, что y = f(x) имеет в точке x0 локальный минимум, если
f(x0) ≤ f(x)
для всех x из некоторой окрестности x0. Если для всех x = x0 из данной окрестности выполнено
f(x0) < f(x),
то, говорят, что в точке x0 функция y = f(x) имеет строгий локальный минимум.
Функция y = f(x) имеет в точке x0 локальный максимум, если для всех x из некоторой окрестности x0 выполнено
f(x0) ≥ f(x).
Если для всех x = x0 из данной окрестности выполнено f(x0) > f(x),
то, говорят, что в точке x0 функция y = f(x) имеет строгий локальный максимум.
Функция f имеет в x0 локальный экстремум, если она имеет в этой точке либо локальный минимум, либо локальный максимум.
ТЕОРЕМА 18.1. Пусть y = f(x1, x2, . . . , xn) – функция n переменных, определенная в области D Rn и име-
ющая там частные производные первого порядка. Если x0 D является точкой локального экстремума функции f, то
∂f |
(x0) = 0 для всех i = 1, 2, . . . , n. |
(1) |
|
||
∂xi |
|
Доказательство. Рассмотрим функцию одной переменной
F (x1) = f(x1 , x02, . . . , x0n).
Данная функция имеет при x1 = x01 локальный экстремум и по соответствующей теореме для одномерного случая можем записать
dF |
(x01) = 0 , т.е. |
∂f |
(x01 , x02, . . . , x0n) = 0. |
|
|
||
dx1 |
∂x1 |
270 |
Глава 12. Функции нескольких переменных |
Рассуждая так при любом фиксированном i = 2, . . . , n, убеждаемся в справедливости системы равенств (1). Теорема доказана.
Как и в случае одной переменной, условия (1) не являются достаточными для существования в точке локального экстремума. Точки области D, в которых имеют место соотношения (1), называются критическими или точками, подозрительными на экстремум.
ПРИМЕР 1. Функция z = y2 − x2 не имеет в точке (0, 0) ни локального максимума ни локального минимума, однако zx(0, 0) = zy(0, 0) = 0. Точка (0, 0) является седловой точкой
графика.
§19. Достаточные условия локального экстремума функции нескольких переменных
Пусть y = f(x) – трижды непрерывно-дифференцируемая функция n переменных, определенная на открытом множестве D Rn и пусть x0 – критическая точка функции f. На основании формулы Тейлора, имеем
∆f(x0) = d2f(x0) + d3f(θ) , 2! 3!