Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
shpora.doc
Скачиваний:
22
Добавлен:
28.10.2018
Размер:
543.74 Кб
Скачать

25. Необходимый признак экстремума в задачах без ограничений первого и второго порядков.

Пусть Х – аффинное пространство, функция f действует из X в нормированное пространство Y. Точку х0∈X назовем точкой локального минимума (локального максимума), если существует такая окрестность х0+U точки х0∈X,  что для всех h∈U выполняется неравенство:     f(x0+h)≥ f(x0) (соответственно, f(x0+h)≤ f(x0)).

Обозначения: Если х0 – точка локального минимума f, то этот факт будем обозначать х0loc min(f), аналогично, х0loc max(f), либо х0loc extr(f).

Теорема 5.5.1. (необходимое условие экстремума первого порядка): если x0loc min(f) (или x0loc max(f)), то  ∀ h ∈ V   δf(x0,h)≥ 0 (δf(x0,h)≤0) .

Доказательство. Пусть x0loc min(f), тогда ∀ h ∈ V для функции φh(t)=f(x0+th) точка t=0 – точка локального минимума. Функция φh рассматривается на промежутке [0, +∞[, следовательно, по необходимому признаку экстремума для вещественных функций, δf(x0,h)= φ '(0) ≥ 0.

Следствие 1. Если x0∈ loc extr(f) и f дифференцируема по Гато в точке x0, то Df(x0)=0, т.е. для всех hV  Df(x0)h = 0.

Доказательство. Если предположить, что существует h0∈V , для которого δf(x0,h0)=Df(x0)h0 > 0, сразу же получим, что  для  –h0∈V выполняется δf(x0,-h0) = Df(x0)(-h0)= – Df(x0)(h0) <0, что противоречит доказанной теореме.

Теорема 5.5.2. (необходимое условие экстремума второго порядка): если х0loc extr(f), f∈D20), то:

1. если х0loc min(f), то ∀ h ∈ V выполняется неравенство D2f(х0)[h,h] ≥ 0;

2. если х0∈loc max(f), то ∀ h ∈ V выполняется неравенство D2f(х0)[h,h] ≤ 0.

Доказательство. Пусть  φh(t)=f(x0+th). По теореме 5.2.1  для всех h∈V  φ' h(0)=δf(x0;h) = Df(x0)h,  φ''h(0)=D2f(x0)[h,h]. Если x0 locmin(f), то 0∈locminh) для всех h∈V. Согласно формуле Тейлора для функции φ h(t), выполняется φ h(t) =  φh(0)+ φ h'(0)t + φ h''(0)t2/2+o(|t|2) при t→ 0.

По следствию 1 из теоремы 5.5.1 φ h'(0)=0, поэтому φ h(t) -  φh(0)=  f(x0+th) - f(x0) = t2/2(φ h''(0)+o(1)).

Если существует h∈V, при котором φh''(0)<0, то при всех достаточно малых t выполняется неравенство φ h''(0)+o(1) < 0, т.е. f(x0+th) - f(x0)<0 – точка х0 не может быть локальным минимумом.

Полученное противоречие доказывает пункт 1. Второй пункт доказывается аналогично.

Замечание. Если Х – аффинное пространство, параллельное  бесконечномерному векторному пространству, то условие Df(x0)h = 0,  ∀ 0 ≠ h ∈ V  D2f(х0)[h,h] > 0 в общем случае не будет достаточным для того, чтобы утверждать, что х0– точка локального минимума.

27 . Правило множителей Лагранжа для гладких нелинейных задач.

Задачу нелинейного программирования вида

f0(x) → min ,fi(x) ≤ 0, i=1,..., m; F(x) = 0.       (5.6.1)

назовем гладкой, если функционалы fi:X→R, i=0,…,m и оператор F:X→Y являются строго дифференцируемыми.

Покажем, что в случае, когда задача (5.6.1) не является выпуклой, к ее исследованию тоже можно применять правило множителей Лагранжа.

Для этого применим следующую теорему, известную как теорема Люстерника о касательном пространстве (теорему применим без рассмотрения ее доказательства).

Теорема 5.6.1. Пусть X, Y – банаховы пространства, F:X→Y, M={x∈X | F(x)=0}, x0∈M, F строго дифференцируемо в точке x0, причем Im(DF(x0))=Y (условие регулярности). Тогда следующие условия эквивалентны:

а) DF(x0)h = 0;

б) существуют ε>0 и отображение r:[-ε, ε]→X, для которых при всех α∈[-ε, ε] выполняется условие

x0+αh+r(α)∈M, причем r(α)=o(α) при α→0.

Следствие 1. Если x0 – решение задачи (5.6.1), то h0=0 является решением задачи

g(h) = max 0≤i≤mDfi(x0)h → min ,DF(x0)h = 0.    (5.6.2)

Доказательство. Предположим, что найдется h1∈X, такой что DF(x0)h1=0 и при этом для всех i=0,…,m справедливы неравенства Ai = Dfi(x0)h1 < 0. Тогда по теореме Люстерника для вектора h1 найдется ε>0 и отображение r:[-ε, ε]→X, такое что при всех α∈[-ε, ε] выполняется  F(x0+αh1+r(α)) = 0, причем r(α)=o(α) при α→0.

Используя условие дифференцируемости отображений fi, при α→+0 получим

fi (x0+αh1+r(α)) = fi (x0)+ Dfi (x0)(αh1+r(α))+o(α) = fi (x0)+ αDfi (x0)h1+o(α) =

= fi (x0)+ α(Ai +o(1)) < fi (x0) (При достаточно малых α>0).

Таким образом, при достаточно малых α > 0 вектор xα=x0+αh1+r(α) удовлетворяет всем ограничениям задачи (5.6.1):

fi (xα) = fi (x0+αh1+r(α)) < fi (x0) ≤ 0 при i=1,…,m;

F(xα) = F(x0+αh1+r(α)) = 0,

и при этом f0 (xα) < f0 (x0) – т.е. x0 не является решением задачи (5.6.1).

Полученное противоречие завершает доказательство следствия.

В результате получаем, что если x0 – решение задачи (5.6.1), то

min DF(x0)h = 0 max 0≤i≤mDfi(x0)h = 0          (5.6.3)

Лемма 5.6.2. Если M – векторное пространство, Ai:M→R, i=0,…,m – линейные операторы. Следующие условия эквивалентны:

а) каждого h∈M найдется номер j, для которого Ajh ≥ 0;

б) существуют λi ≥ 0 , i=0,…,m (не все равные нулю), такие что для всех h∈M выполняется равенство ∑0≤i≤mλiAih = 0.

Доказательство. Не ограничивая общности, можно считать, что М – конечномерное пространство. Доказательство проведем индукцией по m.  Заметим, что при всех m операторы Ai:M→R, i=0,…,m  линейно зависимы, т.к. в противном случае система уравнений  Ai(h) = –1,   i=0,…,m имела бы решение, что противоречит условию.

m = 1. В данном случае у нас есть два линейных оператора A0:M→R, A1:M→R. В силу их линейной зависимости существует λ, такое что для всех h∈M выполняется равенство A1(h) + λA2(h) = 0 (или A2(h) + λA1(h) = 0). Если предположить, что λ<0, получим, что числа A1(h) и A2(h) всегда одного знака, что противоречит условию а). Таким образом, λ>0.

Предположим, что условие леммы справедливо при всех M и всех  m<n. Докажем справедливость утверждения при  m=n.

Пусть M1= {h∈M | Anh=0}. Тогда для каждого h∈M1 найдется номер j<n, для которого Ajh ≥ 0. Действительно, если для всех j=0,…,n-1 выполняется Ajh ≤C< 0, то найдется h*∈M, для которого Anh*<0 и при этом для всех φ=0,…,n-1 Ajh* <C/2< 0, т.е. не выполнено условие леммы.

Таким образом, по предположению индукции существуют не все равные нулю числа λi ≥ 0 , i=0,…,n-1, такие что для всех h∈M1={h∈M | Anh=0} выполняется равенство Bh = ∑0≤i≤n-1 λiAih = 0. В итоге получаем, что всех h∈M справедливо Bh = ∑0≤i≤n-1 λiAih = - λnAnh.

Если равенство Bh = ∑0≤i≤n-1 λiAih = 0 выполняется на всем М, то λn= 0 и задача решена. Если же равенство Bh = ∑0≤i≤n-1 λiAih = 0 не выполняется на всем М, согласно предположению индукции существует h0∈M, для которого для всех j=0,…,n-1 Aih0<0 и поэтому Bh0<0, а значит, - λn An h0<0. Поскольку должно выполняться An h0≥0, получаем λn>0.

Лемма доказана.

Применим доказанную лемму к результатам следствия 1. Согласно следствию 1, если x0 – решение задачи (5.6.1), то для любого h∈{h∈X | DF(x0)h=0} существует номер j, для которого Dfj(x0)h≥0.

Следовательно, существуют λi ≥ 0 , i=0,…,m (не все равные нулю), такие что для всех h∈M={h∈X | DF(x0)h=0} выполняется равенство ∑0≤i≤m λiDfi(x0)h = 0.

Теорема 5.5.3 (об аннуляторе ядра). Пусть X, Y – банаховы пространства, A:X→Y – линейный ограниченный оператор, такой что ImA=Y (регулярность). Тогда множество всех линейных ограниченных функционалов, равных нулю на множестве M={h∈X | Ah=0} (аннулятор ядра оператора А) совпадает с образом сопряженного оператора A*, т.е. если B:X→R и для всех h∈M={h∈X | Ah=0} выполняется равенство Bh=0, то найдется линейный ограниченный функционал y*∈Y*, такой что B = y*A.

Применив к предыдущим рассуждениям теорему об аннуляторе ядра, получаем следующий результат:

Если существуют λi ≥ 0 , i=0,…,m (не все равные нулю), такие что для всех h∈M={h∈X | DF(x0)h=0} выполняется равенство ∑0≤i≤m λiDfi(x0)h = 0, то найдется линейный ограниченный функционал y*∈Y*, такой что Bh = ∑0≤i≤m λiDfi(x0)h = y* DF(x0)h.

Теорема 5.6.4 (Правило множителей Лагранжа). Пусть x0 – решение гладкой задачи нелинейного программирования (5.6.1), причем X, Y – банаховы пространства, Im DF(x0) – замкнутое подпространство в Y (полурегулярность).

Тогда существуют множители Лагранжа – числа λi , i=0,…,m и линейный ограниченный функционал y*∈Y*, (не все равные нулю), такие что выполняются следующие условия:

1. ∑0≤i≤m λiDfi(x0) + y* DF(x0) = 0;         (5.6.4)

2. λif(x0) = 0 , i = 1,…,m;              (5.6.5)

3. λi ≥ 0 , i=0,…,m.        (5.6.6)

Доказательство существования множителей Лагранжа и выполнение условий (5.6.4) и (5.6.6) получено ранее. Если x0 – решение задачи (5.6.1) и для некоторого i выполняется строгое неравенство fi(x0) < 0, то в силу непрерывности функционала fi в некоторой окрестности точки x0 данное неравенство будет сохраняться, т.е. это неравенство не накладывает существенного ограничения в задаче, т.е. при удалении этого ограничения вектор x0 останется решением. Этот факт можно отразить путем выбора соответствующего λi равным 0. Если же fi(x0)=0, условие (5.6.5) будет тоже выполнено.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]