Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие ПП (главы 3 и 4).doc
Скачиваний:
54
Добавлен:
09.04.2015
Размер:
3.05 Mб
Скачать

3.4. Исследование задачи математического программирования

Постановка общей задачи математического программирования может быть представлена в виде:

(3.4.1)

Здесь в качестве рассматривается множество простой структуры (шар, параллелепипед, пространство, неотрицательный ортант). Следует отметить, что к задачам типа (3.4.1) относятся задачи линейного программирования. Важным классом задач математического программирования являются задачи выпуклого программирования, т.е. задачи минимизации (или максимизации) выпуклых функций на выпуклых множествах. В этом случае в (3.4.1)– заданное выпуклое множество; функции,выпуклы на,– линейные функции, т.е.при;– заданные векторы из,– заданные числа. При этом не исключаются возможности, когда отсутствуют либо ограничения типа неравенств(), либо ограничения типа равенств(), либо оба эти вида ограничений. Во всех отмеченных случаях допустимое множество задачи является выпуклым. Среди задач математического программирования выделяют также класс задач, формулируемых в виде так называемой классической задачи. Классической задачей математического программирования является задача, сформулированная в виде:

(3.4.2)

Другой важной разновидностью задач математического программирования являются задачи квадратичного программирования. Задача квадратичного программирования формулируется в виде:

(3.4.3)

Здесь – симметрическая неотрицательно определенная матрица (т.е.) размерности;,. При этом допускаются случаи, или, или. В задаче (3.4.3) квадратичная выпуклая функция минимизируется на многогранном множестве (многогранное множество иначе называют полиэдром). Такие задачи возникают в различных приложениях. Примерами задач квадратичного программирования являются задачи определения расстояния от точки до многогранного множества, проектирования на такое множество, когда матрицав (3.4.3) является единичной. Задачи квадратичного программирования возникают также как вспомогательные при описании различных методов минимизации. Существующие методы позволяют получать решение задачи (3.4.3) за конечное число шагов (примером такого метода является метод сопряженных градиентов).

Рассмотрим подход к исследованию задачи (3.4.2), основанный на использовании метода множителей Лагранжа. Этот метод заключается в следующем. Вводится функция Лагранжа

(3.4.4)

где ,– скалярная переменная,. Последующее использование этой функции вытекает из результатов теоремы 3.4.1.

Теорема 3.4.1

Пусть функции непрерывно дифференцируемы в окрестности точки,. Тогда если– локальное решение задачи (3.4.2), то необходимо существуют числа(называемые множителями Лагранжа), не все равные нулю, такие, что

(3.4.5)

где .

Доказательство. С учетом (3.4.4) выражение (3.4.5) может быть записано в виде:

(3.4.6)

Поскольку не все числа равны нулю, из (3.4.6) следует, что векторылинейно зависимы. Допустим противное: пусть эти векторы линейно независимы. Тогда. В случаевозьмем какие-либо векторытак, чтобы системаобразовала базис в.

Введем функции переменных, где. Рассмотрим систему уравнений:

относительно неизвестных. Для ее исследования воспользуемся теоремой о неявных функциях. Заметим, что.

Далее, функции непрерывно дифференцируемы в окрестности точки, причем . Это значит, что в точкеякобиан системы функций, представляющий собой определитель квадратной матрицы со строками, образующими базис в, отличен от нуля. Тогда по теореме о неявных функциях системаимеет решение при каждом, где– достаточно малое положительное число, или, точнее, существует вектор-функция, которая определена и дифференцируема при всехи такая, что

Это значит, что при.

Отсюда также следует:

что противоречит тому, что – локальное решение задачи (3.4.2). Таким образом, точкаможет быть точкой локального минимума лишь в том случае, если выполнение условия (3.4.5) имеет место, когда не все числаравны нулю. Теорема доказана.

Из доказанной теоремы следует, что подозрительными на экстремум могут быть лишь те точки , для которых существуют множителитакие, что точкаудовлетворяет системеуравнений

(3.4.7)

и, кроме того, известно, что . Справедливо также утверждение, состоящее в том, что всякое решение задачи (3.4.2) удовлетворяет системе (3.4.7). Поэтому для отыскания решения задачи (3.4.2) следует найти все решения системы (3.4.7), для каждого из них вычислить значение целевой функциии затем, сравнив полученные значения целевой функции, определить точку, являющуюся искомым решением.

Нетрудно заметить, что если – решение системы (3.4.7), топри любомтакже является решением этой системы. Поэтому множителиможно подчинить какому-либо дополнительному условию нормировки, например,

(3.4.8)

Добавив уравнение (3.4.8) к уравнениям (3.4.7), получим систему из уравнений.

Если система (3.4.7) имеет решения такие, что, то задачу (3.4.2) называют регулярной (невырожденной) в точке. В регулярной задаче в качестве условия нормировки можно использовать условие. Нетрудно видеть, что для регулярности задачи в точкедостаточно, чтобы векторыбыли линейно независимы, т.е. чтобы равенствобыло возможно только при.

Метод множителей Лагранжа может быть применен для поиска экстремумов функции и в тех случаях, когда на переменные наряду с ограничениями типа равенств накладываются еще и ограничения типа неравенств:

(3.4.9)

Предположим, что функции не только определены, но и дифференцируемы во всех точках. Оказывается, если ввести новые вспомогательные переменные, связанные с исходными переменными соотношениями

(3.4.10)

то задача поиска экстремумов функции при ограничениях задачи (3.4.9) сводится к равносильной задаче поиска экстремумов той же функции в пространстве переменныхпри ограничениях типа равенстви (3.4.10). Равносильность этих двух задач понимается в следующем смысле: если– локальное решение задачи (3.4.9), то, гдебудет локальным решением задачи

(3.4.11)

и наоборот, если – локальное решение задачи (3.4.11), тоявляется локальным решением задачи (3.4.9).

Таким образом, для решения задачи (3.4.11) можно использовать функцию Лагранжа

(3.4.12)

и в соответствии с вышеизложенным записать необходимые условия экстремума в виде системы (3.4.7), найти точки, подозрительные на экстремум, выявить среди них решение задачи (3.4.11) и затем, исключив из него значения , получить искомое решение задачи (3.4.9) в виде.

Пример 3.4.1

Заданная функция является сильно выпуклой на, т.к., где,и. Следовательно, задача имеет решение. Найдем это решение с помощью необходимого условия существования экстремума. Функция Лагранжа (3.4.4) в данном случае имеет вид:

Вычислим частные производные функции Лагранжа по переменным :

,

и составим систему уравнений вида (3.4.7):

(3.4.13)

Анализируя полученную систему, приходим к выводу о том, что случай невозможен. Это объясняется тем, что при, согласно теореме 3.4.1,и из первых двух уравнений системы следует, однако эта пара значений не удовлетворяет третьему уравнению. Поэтому положим. Здесь мы подразумеваем использование нормирующего множителя,, так как если– решение системы (3.4.13), то, где, также будет являться ее решением. Подставим в систему (3.4.13) значениеи найдем ее решения:

На каждом из найденных решений вычислим значения целевой функции и определим минимальное из них:

поскольку , значениеявляется минимальным. Таким образом,есть искомое решение задачи.

Выше метод множителей Лагранжа был рассмотрен применительно к исследованию задач (3.4.2) и (3.4.9). С помощью функции Лагранжа было сформулировано необходимое условие оптимальности. Важная роль принадлежит функции Лагранжа и при исследовании более общей задачи (3.4.1). Соответствующая теорема, доказательство которой можно найти, например, в [1], формулируется следующим образом.

Теорема 3.4.2

Пусть точка – локальное решение задачи (3.4.1), функциидифференцируемы в точке, функциинепрерывно дифференцируемы в некоторой окрестности точки,– выпуклое множество. Тогда существуют не все равные нулю числа такие, чтовыполнены соотношения:

(3.4.14)

(3.4.15)

где – градиент функциипеременнойв точке.

Ограничение , где, называют активным (пассивным) в точке, если(). Из условий (3.4.15), часто называемых условиями дополняющей нежесткости, следует, что множители Лагранжа, соответствующие пассивным ограничениям типа неравенств, равны нулю.

Задачу (3.4.1) называют регулярной (невырожденной) в точке , если существуют множители Лагранжас координатой; в противном случае задача (3.4.1) называется нерегулярной (вырожденной).

Простейший класс регулярных задач получается из (3.4.1) при ; тогда допустимое множество задачи. В этом случае ограничения типа равенств и неравенств в (3.4.1) отсутствуют и нет необходимости вводить множители, поэтому, условия (3.4.15) исчезают; кроме того, из утверждения теоремы 3.4.2 следует, что, тогда неравенство (3.4.14) превратится в условие, известное из теоремы 3.3.4. Регулярность задачи (3.4.1) гарантируется также и в том случае, когдаи градиентылинейно независимы. Действительно, для пассивных ограниченийи условие (3.4.14) прибудет иметь вид

Если бы здесь было , то в силу линейной независимостиполучили быдля всех, но тогда, что противоречит теореме 3.4.2.

Из теоремы 3.4.2 следует, что в задаче (3.4.1) с гладкими функциями на выпуклом множестведля поиска точек минимума (локального или глобального) нужно решить систему

(3.4.16)

(3.4.17)

(3.4.18)

относительно переменных.

Если какие-либо получены из системы (3.4.16) – (3.4.18), топри любомтакже удовлетворяют этой системе. Это значит, что множители Лагранжа из (3.4.16) – (3.4.18) определяются с точностью до постоянного положительного множителя. Поэтому множители Лагранжа можно подчинить какому-либо дополнительному условию нормировки, например, условию (3.4.8). В регулярной задаче вместо (3.4.18) можно взять. Отсюда следует, что систему (3.4.16) – (3.4.18) достаточно исследовать для двух значений: прии при. Условия (3.4.16) – (3.4.18) вместе с условием нормировки (3.4.8) (илив регулярной задаче) дают «полную» систему соотношений для определения основных переменныхи соответствующих множителей Лагранжа.

В регулярных задачах выпуклого программирования важную роль играет следующая теорема.

Теорема 3.4.3

Пусть задача (3.4.1) является задачей выпуклого программирования, функции дифференцируемы на выпуклом множествеи пусть в точкевыполнены условия (3.4.14), (3.4.15) теоремы 3.4.2 с,. Тогда точкаявляется глобальным решением рассматриваемой задачи выпуклого программирования.

Доказательство. Поскольку рассматривается задача выпуклого программирования, функции являются выпуклыми на множестве. В соответствии с (3.4.4), функция Лагранжав данном случае имеет следующий вид:

(3.4.19)

Согласно теореме 3.1.1, функция (3.4.19) является выпуклой на по переменной, так как функциивыпуклы на,, функциилинейны и если при некотороммножитель, то путем замены в (3.4.19) соответствующего слагаемогонаполучаем произведение положительного множителяна функцию, являющуюся, как и, линейной и, следовательно, выпуклой. Кроме того, в соответствии с условием теоремы,выполнено неравенство. Тогда по теореме 3.3.4 выпуклая функция (3.4.19) достигает минимума на множествев точке. Это означает, чтовыполнено неравенство, которое можно записать в виде:

(3.4.20)

так как в силу выполнения условий (3.4.15). Посколькувыполнены условия, то при этом будет также выполнено соотношение

Тогда из (3.4.20) получаем:, т.е. точкаявляется глобальным решением рассматриваемой задачи выпуклого программирования. Теорема доказана.

Важное место в теории выпуклого программирования занимает также следующая теорема (приводим только формулировку).

Теорема 3.4.4

Пусть в задаче (3.4.1) функции являются выпуклыми на выпуклом множестве(– полиэдр), а функции– линейными. Пусть точкаявляется решением задачи (3.4.1) в рассматриваемой постановке, функциидифференцируемы наи выполнено одно из следующих условий:

1) , т.е. имеем только ограничения типа неравенств, и(условие Слейтера);

2) функции являются линейными.

Тогда существуют числа такие, что выполнены условия (3.4.14), (3.4.15).

Таким образом, выполнение условий 1 или 2 теоремы 3.4.4 приводит к выполнению соотношений (3.4.14), (3.4.15) с . Объединяя результаты, полученные в материале данного раздела, сформулируем теорему Куна-Таккера, известную также под названием теоремы о седловой точке функции Лагранжа.

Теорема 3.4.5

Пусть рассматривается задача (3.4.1) и пусть она является задачей выпуклого программирования с ограничениями, удовлетворяющими условию 1 или условию 2 теоремы 3.4.4, а функции дифференцируемы на множестве. Тогда условия (3.4.14), (3.4.15) сявляются необходимыми и достаточными условиями оптимальности.