Метод неопределенных множителей Лагранжа
В классическом анализе этот метод ориентирован на решение задач на условный экстремум, когда условия имеют вид равенств:
f(X) ® extr, i(X)=0, i=. (3.17)
Очевидно, что задача (3.17) имеет смысл при m<n, когда система равенств имеет неединственное решение. В предыдущем разделе к таким задачам применялся метод подстановки (исключения зависимых переменных), который сводит исходную задачу к задаче на безусловный экстремум с меньшим числом переменных. На первый взгляд может показаться, что это очень удобный прием. Но на практике далеко не всегда можно разрешить m уравнений относительно m переменных, а в тех случаях, когда это возможно, получающиеся выражения часто оказываются слишком сложными.
Метод множителей Лагранжа тоже преобразует исходную задачу в задачу на безусловный экстремум, но, в противоположность предыдущему методу, за счет увеличения числа неизвестных.
Для лучшего понимания сути метода сначала покажем, как получаются необходимые условия условного экстремума в задаче с двумя переменными, а затем сделаем обобщение.
Итак, найдем экстремум функции f(x1,x2) при условии
(x1,x2)=0. (3.18)
Этим равенством задается допустимая область D, в которой одна из переменных становится зависимой. Пусть зависимой переменной будет x2. В стационарной точке производные первого порядка по независимым переменным равны нулю. В нашем случае имеется только одна независимая переменная - x1, поэтому в нуль обращается полная производная целевой функции по x1. Используя правила дифференцирования неявной функции, получаем:
(3.19)
где - частные производные поx1 и x2 соответственно.
В области D функция постоянна, следовательно, производная этой функции по независимой переменной равна нулю:
(3.20)
В точке экстремума выполняются одновременно условия (3.19) и (3.20). Исключая из них , приходим к равенству
,
которое показывает, что в точке условного экстремума соблюдается равенство отношений частных производных целевой функции и функции условия по одноименным переменным. Обозначим это отношение постоянной . Полученное равенство
можно представить в виде
(3.21)
. (3.22)
Действительно, взяв производные F по x1 и x2 и приравняв их нулю, получим равенства (3.21), а =0 дает (3.18). Новая функцияF называется функцией Лагранжа, а неизвестная постоянная -неопреде-ленным множителем Лагранжа.
Канторович Л.В. придает множителю экономический смысл. Если подf(X) понимать доход, соответствующий плану выпуска продукции X, а под (X) - ограничение на издержки ресурса, тоимеет смысл «цены» этого ресурса: доказывается, что производная оптимального значения функцииf по ограничению с точностью до знака равна . Иначе говоря, множитель Лагранжа характеризует влияние изменения ресурса на оптимальное значение критерия. В такой трактовкеназываютмаргинальной оценкой ресурса (в теории двойственности является двойственной переменной).
Можно показать, что и в общем случае справедлив такой подход. Опуская доказательства, приведем окончательный результат. Для задачи (3.17) функция Лагранжа записывается в виде
(3.23)
где - вектор неопределенных множителей Лагранжа размерностиm. Отсюда следует, что функция Лагранжа представляет собой сумму целевой функции и парных произведений множителей на левые части условий. Необходимые условия по X дают n уравнений:
.
Добавляя к ним m равенств , получаем полную систему уравнений для отысканияn+m неизвестных.
Несмотря на увеличение числа неизвестных этот подход приводит к более простой системе уравнений, чем при использовании метода исключения переменных, и поэтому более предпочтителен. К функции Лагранжа, естественно, приложимы также достаточные условия экстремума (3.5),(3.6).
Применение метода Лагранжа проиллюстрируем двумя примерами. Первый пример призван показать технику и преимущество метода. Пусть требуется найти максимум функции f=x1+x2+x1x2 при условии
(3.24)
Сначала применим метод исключения. Из (3.24) выразим x2
,
и, подставив в целевую функцию, получим
.
В результате пришли к задаче на безусловный максимум функции одной переменной. Взяв производную по x1 и приравняв ее нулю, после элементарных преобразований имеем
Способ нахождения x1 из этого уравнения не очевиден. Даже в такой простой задаче применение метода исключения вызывает затруднения.
Теперь воспользуемся методом Лагранжа. Для нашей задачи функция Лагранжа записывается в виде
.
Необходимые условия дают два уравнения:
которые при фиксированном представляют собой линейную систему с двумя неизвестными. В данном случае она решается особенно просто: из симметрии относительно переменных следует, что в стационарной точке они равны между собой. Поэтому сразу имеем
Подставив это выражение в (3.24), получаем
или .
Таким образом, условный экстремум может достигаться в точках
.
Легко проверить, что положительные значения соответствуют максимуму при любом R, а отрицательные - минимуму только в определенном интервале R. (Убедиться в этом можно, записав достаточные условия экстремума функции F по переменным x1 и x2.)
Во втором примере рассмотрим одну из типичных задач исследования операций и увидим, что даже в общем случае применение метода множителей Лагранжа оказывается полезным, приводя к интересным качественным результатам.
Задача распределения ресурсов. В системе имеется m видов ресурсов в количестве , иN предприятий, нуждающихся в этих ресурсах. Однако ресурсов недостаточно для удовлетворения каждого предприятия оптимальным образом. Прибыль предприятия зависит как от количества выделяемых ему ресурсов, так и от управления на уровне предприятия:
.
Здесь vi =(vi1,vi2,...,vim) - вектор ресурсов, выделяемых i-му предприятию; ui=(ui1,ui2,...,uiv) - вектор индивидуальных управлений i-го предприятия. Необходимо так распределить имеющиеся ресурсы, чтобы суммарная прибыль предприятий была максимальной.
Модель задачи имеет вид:
, (3.25)
, (3.26)
. (3.27)
Допустимое множество управлений Di не задано в явном виде, и его свойства не оговариваются.
Реальные задачи такого типа из-за их большой сложности не удается решать «в лоб». Поэтому задачу разбивают, если это возможно, на ряд более простых задач. Такой прием называют декомпозицией задачи. В нашем случае декомпозиция возможна, так как в задаче (системе) явно просматриваются два уровня принятия решений: на верхнем уровне распределяются все ресурсы исходя из цели системы в целом, а на нижнем каждое предприятие стремится использовать выделяемые ему ресурсы наилучшим образом в собственных интересах (рис. 3.6). Следовательно, при таком разбиении имеем одну задачу верхнего уровня и N задач нижнего уровня.
Но задачи обоих уровней связаны между собой: для решения задач одного уровня надо знать решение другого. Выйти из замкнутого круга можно в тех случаях, когда удается найти параметрическое решение задач одного из уровней. В рассматриваемой системе таким является нижний уровень.
Каждая из N задач нижнего уровня ставится так: найти зависимость максимальной прибыли предприятия от выделяемых ему ресурсов. Для этого нужно решить задачу
(3.28)
для всех возможныхvi. Метод решения задачи (3.28) здесь не рассматриваем, так как он может быть выбран только при явном задании модели. В результате решения этой задачи получим искомые функции и ui(vi). Тогда задача (3.25)-(3.27) преобразуется в задачу верхнего уровня
, (3.29)
. (3.30)
Если функции дифференцируемы (что будем предполагать), то к этой задаче применим метод множителей Лагранжа. Расширенная функция (функция Лагранжа) задачи (3.29),(3.30) имеет вид
(3.31)
Необходимые условия экстремума функции F дают систему mN уравнений
которую перепишем в виде
. (3.32)
Так как правая часть в (3.32) не зависит от i, то из этой системы следует цепочка равенств
. (3.33)
Подводя итог рассмотрению методов классического анализа, отметим, что они могут применяться для решения задач оптимизации небольшой размерности и с простой структурой множества D. Задачи математического программирования, к которым сводится большинство задач исследования операций, требуют более мощных методов. Изучению этих методов посвящены главы 4-9.
Для закрепления пройденного материала в следующем разделе предлагается самостоятельно исследовать две задачи, одна из которых рассматривалась в разделе 3.1.