- •Содержание
- •Предисловие
- •Глава I. Нелинейное программирование: экстремумы функций нескольких переменных
- •§1. Классические методы оптимизации
- •1.1. Безусловный экстремум функции одной переменной
- •1.2. Условный экстремум функции одной переменной
- •1.3. Безусловный экстремум функций двух переменных
- •1.4. Упражнения.
- •§2. Безусловный экстремум функций нескольких переменных
- •2.1. Необходимые и достаточные условия
- •§3. Условный экстремум функций нескольких переменных
- •3.1. Основные определения и факты
- •3.2. Условный экстремум при ограничениях типа равенств
- •3.3. Условный экстремум при ограничениях типа неравенств
- •3.4. Условный экстремум при смешанных ограничениях
- •3.5. Понятие о методах штрафных функций
- •Глава II. Численные методы нелинейного программирования
- •§1. Общие положения
- •1.1. Постановка проблемы
- •1.2. Общие принципы.
- •§2. Методы нулевого порядка одномерной минимизации
- •2.1. Общие положения
- •2.2. Метод равномерного поиска
- •2.3. Метод деления интервала пополам
- •§3. Методы первого и второго порядка
- •3.1. Метод градиентного спуска с постоянным шагом
- •3.2. Метод Ньютона
- •§4. Элементы численных методов задачи условной оптимизации выпуклого программирования
- •4.2. Постановка задачи выпуклого программирования.
- •4.3. Численные методы на основе метода штрафных функций
- •4.4. Метод проекции градиента.
- •Приложение 1. Варианты индивидуальных заданий
- •Задание нп-1
- •Задание нп-2
- •Задание нп-3
- •Задание нп-4
- •Задание нп-5
- •Задание нп-6
- •Задание нп-7
- •Задание нп-8
§3. Условный экстремум функций нескольких переменных
Напомним, что если в задаче (1) присутствует система ограничений, то задача называется задачей условной оптимизации. Множество, определяемое системой ограничений, обозначим через М. Таким образом, задачу условной оптимизации в общем виде можно записать так:
f(X) min (max)
(3.1)
3.1. Основные определения и факты
Если k=m, то задача (3.1) называется задачей с ограничениями типа равенств, при k=0 задачей с ограничениями типа неравенств, при k<m задачей со смешанными ограничениями.
Ограничение i(X)0 называется активным в точке X*, если i(X*)=0. В противном случае оно называется пассивным. Множество индексов ограничений, активных в точке X*, обозначим через Ia.
Функция
L(X,
0,
)=0f(X)+
называется обобщённой функцией Лагранжа, числа 0, 1, 2,…, m множителями Лагранжа, =(1, 2,…, m). При 0=1 функция Лагранжа обращается в классическую функцию Лагранжа
L(X, )=f(X)+ .
Градиентом обобщённой (классической) функции Лагранжа называется вектор-столбец, составленный из её частных производных первого порядка по xi, i=1, 2, … , n:
L=
.
Из контекста всегда будет ясно, о чём идёт речь о градиенте обобщённой или классической функции. Аналогично градиенту, можно рассматривать первые и вторые дифференциалы функций ограничений и Лагранжа по переменным x1, x2, …, xn:
di(X)=
(i=1,
2, …, m),
d2L=
.
Очевидно, если L(X, 0, ) является дважды непрерывно дифференцируемой функцией, то d2L является квадратичной формой от переменных dx1, dx2, …, dxn. Поэтому можно рассматривать вопрос о её знакоопределённости с использованием критериев, сформулированных во Введении.
3.1.1.
(Необходимые условия экстремума первого
порядка).
Пусть X*Rп
точка
локального минимума
(максимума)
функции
f(X)
на множестве
М.
Тогда
существуют числа
0,
,
…,
,
не равные
одновременно нулю и такие,
что выполняются
условия:
условия стационарности обобщённой функции Лагранжа по X:
=0,
j=1,
2, …, n; (3.1.1.a)
условие допустимости решения:
i(X*)=0, i=1, 2, …, k; i(X*)0, i=k+1, …, m; (3.1.1.б)
условие неотрицательности для условного минимума:
0,
i=k+1,
…, m (3.1.1.в)
(условие неположительности для условного максимума 0, i=k+1, …, m);
условие дополняющей нежёсткости:
i(X*)=0, i=k+1, …, m; (3.1.1.г)
Если при этом градиенты 1(X*), 2(X*), …, m(X*) в точке X* линейно независимы, то ≠0 (условие регулярности).
Точки, удовлетворяющие системе (3.1.1) при некоторых , *=( , …, ), называются условно-стационарными. При этом, если ≠0, то условно-стационарная точка называется регулярной, а при =0 нерегулярной.
Особо отметим, что при i=k+1, …, m не могут иметь разные знаки.
3.1.2. (Необходимые условия экстремума второго порядка) Пусть X*Rп регулярная точка локального минимума (максимума) функции f(X) на множестве М и имеется решение (X*, *) системы (3.1.1). Тогда второй дифференциал классической функции Лагранжа, вычисленный в точке (X*, *), неотрицателен (неположителен):
d2L(X*, *)0 (d2L(X*, *)0) (3.1.2а)
для всех таких dxRп, что
di(X*)=0 (i=1, 2, …, m) (3.1.2б)
и iIa, >0 ( <0);
di(X*)0, iIa, =0.
3.1.3. (Достаточные условия экстремума первого порядка) Пусть (X*, *) точка, удовлетворяющая системе (3.1.1) при ≠0, суммарное число активных ограничений-неравенств в точке X* и ограничений-равенств совпадает с числом n переменных. Если >0 для всех iIa, то точка X* точка условного локального минимума. Если <0 для всех iIa, то X* точка условного локального максимума.
3.1.4. (Достаточные условия экстремума второго порядка) Пусть (X*, *) точка, которая является решением системы (3.1.1) при ≠0. Если в этой точке дифференциал классической функции Лагранжа, положителен (отрицателен)
d2L(X*, *)>0 (d2L(X*, *)<0)
для всех таких dxRп, что
di(X*)=0 (i=1, 2, …, m) и iIa, >0 ( <0); (3.1.3)
di(X*)0, iIa, =0,
то точка X* является точкой локального минимума (максимума) задачи.
Замечания. 1. Ясно, что для выполнения достаточного условия экстремума второго порядка достаточно знакоопределённости d2L(X*, *). Поэтому достаточно проверить знакоопределённость d2L(X*, *) в общем случае. Если знакоопределённости d2L(X*, *) в общем случае нет, то нужно проверить знакоопределённость для всех dxRп таких, для которых выполняются условия (3.1.3).
2. при i=k+1, …, m не могут иметь разные знаки.
3. Из 3.1.2 и 3.1.4 вытекает, что знаки d2L(X*, *) и для iIa должны согласовываться, то есть они не могут иметь разные знаки.
Общая схема решения задачи на условный экстремум заключается в следующем:
1) С помощью необходимых условий первого порядка (решая систему (3.1.1)) находят условно-стационарные точки.
2) Эти точки проверяются на экстремум с помощью достаточных условий первого порядка. Если эти условия выполняются, то делается соответствующий вывод и вычисляется значение функции в этой точке.
3) Если достаточные условия первого порядка не выполняются, то для точки проверяется достаточное условие экстремума второго порядка.
4) Если достаточные условия второго порядка не выполняются, то для точки проверяется необходимое условие экстремума второго порядка. Если они не выполняются, то в точке экстремума нет. А если выполняются, то требуются дополнительные исследования для выяснения, является ли точка точкой экстремума. Например, попытаться в достаточно малой окрестности стационарной точки X* найти две точки X1 и X2, такие, что f(X1)<f(X*)<f(X2). Тогда, ясно, точка X* не является точкой экстремума.
Ясно, что в задачах разного типа в зависимости от наличия (отсутствия) ограничений различного вида, эти условия имеют некоторые особенности. Поэтому задачи каждого типа рассмотрим в отдельности.
