Добавил:

lublyanka Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"

Предмет:

Теория принятия решений

Файл:

Учебники ТПР / Учебник ТПР_3.2.doc

Скачиваний:

242

Добавлен:

17.06.2016

Размер:

656.9 Кб

Скачать

☆

1 / 71 2 3 4 5 6 7 > Следующая >>>

153

3.2. Задачи нелинейного программирования

________________________________________________________________________________________________________

3.2. Задачи нелинейного программирования

Постановка задачи нелинейного программирования.

В классической теории оптимизации для нахождения точек максимума и минимума (экстремальных точек) целевой функции в условиях, как отсутствия, так и наличия ограничений на переменные, широко используется аппарат дифференциального исчисления [11]. На использовании этого аппарата построено большинство алгоритмов решения задач нелинейного программирования.

Классическая задача нелинейного программирования ставится следующим образом:

Минимизировать целевую функцию W=W(Ф) при ограничениях g(Ф)=0,

где Ф = (₁, ₂, …, _n), ФR_n, g(Ф) = (g₁(Ф), g₂(Ф), …, g_m(Ф))^T.

Ограничения g(Ф) заданы в виде равенств:

, где b_i – число, ограничивающее i–й ресурс.

Ограничения на область допустимых значений каждого _iQ_i могут быть заданы и могут отсутствовать. Функции W(Ф) и g_i(Ф) (i = 1, 2, ..., т), в общем случае не линейно зависят от своих аргументов, но предполагаются дважды непрерывно дифференцируемыми.

Однако множество задач нелинейного программирования требует не минимизации, а максимизации значений целевой функции, ограничения в них часто задаются в виде неравенств.

Поэтому для всех задач нелинейного программирования, которые поставлены не в классической форме, рекомендуется:

 преобразовать целевую функцию, которую следует максимизировать, таким образом, чтобы полученную в результате преобразования функцию необходимо было минимизировать;

 преобразовать ограничения, заданные в виде неравенств к ограничениям, заданным в виде равенств, путем ввода в W(Ф) и g_i(Ф) дополнительных переменных.

Заметим, что п – общее количество переменных в целевой функции и функциях ограничениях, т – количество уравнений функций ограничений. При т > п по меньшей мере т – п уравнений системы являются избыточными. После устранения избыточности количество независимых уравнений в системе становится равным т ( п). Если т = п, решением является Ф = 0. При этом точка Ф не имеет допустимой окрестности, и, следовательно, пространство решений задачи состоит из единственной точки. Такая ситуация является тривиальной.

В ситуации, когда т < п, обычно стремятся выразить т переменных через остальные п – т переменных, а затем исключить их из числа элементов целевой функции, заменив эти т переменных их выражением через остальные п – т переменных. В этом случае задача нахождения условного экстремума превращается в задачу нахождения безусловного экстремума функции W(Z) = (₁, …, _n_–_m). Данный способ положен в основу нескольких методов решения задач нелинейного программирования: метода приведенного градиента (метода Якоби), метода исключения, метода множителей Лагранжа [19].

Геометрическое решение

задач нелинейного программирования.

Геометрическое решение задач нелинейного программирования возможно и очень наглядно, когда количество аргументов целевой функции не превышает двух. В противном случае геометрические построения пришлось бы строить в n-мерном пространстве (n > 3), что является практически не реализуемым и совсем не наглядным.

Суть данного решения заключается:

в построении на числовой оси (при W(₁)) или на плоскости (при W(₁, ₂)) графика области определения аргументов (допустимых координат векторов оценок свойств альтернатив). Данный график является проекцией на числовую ось ₁ или на плоскость ₁, ₂ кривой или поверхности, ограничивающей возможные значения целевой функции. Он определяет множество точек (плоскости) пространства – возможных значений целевой функции;
в пространственном представлении и построении кривой целевой функции (W(₁)) или поверхности (ее проекции на плоскость вектора оценок свойств альтернатив) целевой функции (W(₁, ₂));
в визуальном определении точек целевой функции, являющихся экстремумами целевой функции и удовлетворяющими ограничениям.

Пример 1:

Требуется найти минимум целевой функции: W(Ф) = (₁– 2)²+ (₂– 1)²,

при ограничениях: g(Ф) = ₁² – ₂ + 2 = 0.

Решение:

Построим на плоскости с осями координат ₁, ₂ параболу, заданную уравнением функции ограничения: ₂ =₁² + 2. Эта парабола проходит через точки плоскости: (0, 0), (1, 3), (–1, 3), (2, 6), (–2, 6), (3, 11), (–3, 11). По данным точкам построим график функции. Эта парабола является пересечением поверхности допустимых значений W() и плоскости с осями координат ₁, ₂. Поверхность допустимых значений W() перпендикулярна плоскости ₁, ₂.
Выясним, какой геометрической фигурой является целевая функция W() = (₁– 2)²+ (₂– 1)². Из геометрии известно, что x²+y²=R² есть уравнение окружности с радиусом R и центром в начале координат. В нашем случае таких окружностей можно построить бесконечное множество (в зависимости от значений ₁ⁱ, ₂ⁱ), каждая из которых будет удалена от плоскости с осями координат ₁, ₂ на величину W(ⁱ)= R_i². Самая маленькая из этих окружностей является точкой на плоскости ₁, ₂ с координатами (2, 1). Радиус этой окружности R=0. Множество таких окружностей образует поверхность конуса, перпендикулярного плоскости ₁, ₂ и имеющего с ней одну общую точку (2, 1).
Поскольку минимальное значение целевой функции соответствует минимальному расстоянию между поверхностью конуса и плоскостью ₁, ₂, то при отсутствии ограничений это значение было бы достигнуто в точке (2, 1). Но при данном ограничении минимальное значение целевой функции должно принадлежать как поверхности конуса W() = (₁– 2)²+ (₂– 1)², так и поверхности допустимых значений W(), пересечением которой с плоскостью ₁, ₂является парабола g() = ₁² – ₂ + 2 = 0. Как видно на графиках (рис. 3.2.1), эта точка имеет координаты ₁⁰ 0,55 ₂⁰2,31, а целевая функция в этой точке принимает значение:

W(⁰)=(0,55 – 2)²+(2,31 – 1)²3,8.

₂

₂=₁²+2

W()=(₁–2)²+(₂–1)²

R=3; W()=9

R=2; W()=4

⁰

R=1; W()=1

₁

R=0; W()=0



–1

–3

–2

–5

–4

Рис. 3.2.1. Графики целевой функции и ограничения

Решение задач нелинейного программирования

методом приведенного градиента (метод Якоби)

Пусть задача нелинейного программирования поставлена в классической форме:

Минимизировать W = W(Ф) при ограничениях g(Ф) = 0,

где Ф = (₁, ₂, …, _n), g = (g₁, g₂, …, g_m)^T.

Функции W(Ф) и g_i(Ф), i = 1, 2, ..., т, предполагаются дважды непрерывно дифференцируемыми.

Идея использования приведенного градиента заключается в том, чтобы найти замкнутое аналитическое выражение для первых частных производных функции W(Ф) во всех точках, удовлетворяющих ограничениям g(Ф) = 0. Соответствующие стационарные точки определяются из условия равенства нулю указанных частных производных. Затем можно использовать достаточные условия для классификации найденных стационарных точек, сформулированные в параграфе 3.1.

Для пояснения изложенной идеи рассмотрим функцию W(₁, ₂), график которой представлен на рис. 3.2.2. Предположим, что эту функцию необходимо минимизировать при ограничении g₁(₁, ₂)= ₂ - b = 0, где b — некоторая константа. На рис. 3.2.2 видно, что кривая, которая проходит через точки А, В и С, состоит из значений функции W(₁, ₂), для которых заданное ограничение выполнено. В соответствии с рассматриваемым методом определяются компоненты приведенного градиента функции W(₁, ₂) в каждой точке кривой АВС. Точка В, в которой приведенная производная обращается в нуль, является стационарной для рассматриваемой задачи с ограничением.

Теперь рассмотрим общую математическую формулировку метода. Из теоремы Тейлора следует, что для точек Ф + ΔФ из окрестности точки Ф имеем

W(Ф + ΔФ) – W(Ф) = W(Ф)ΔФ + О(Δ_j²),

g(Ф + ΔФ) – g(Ф) = g(Ф) ΔФ + О(Δ_j²).

При Δ_j  0 эти уравнения принимают вид

W(Ф) = W(Ф)Ф, g(Ф) = g(Ф)Ф,

где W, g – скорости изменения функций (градиенты) W и g по всем переменным Ф.

Поскольку g(Ф) = 0, то и g(Ф) = 0 в допустимой области. Отсюда следует, что:

W(Ф) – W(Ф)Ф= 0, g(Ф)Ф =0.

Как видим, задача сводится к решению т + 1 уравнений с п + 1 неизвестными, которыми являются W(Ф) и Ф. Неизвестную величину W(Ф) можно определить, как только будет найден вектор Ф. Это означает, что, по существу, имеется т уравнений с п неизвестными.

Рис. 3.2.2. Целевая функция, ограничение, безусловный и условный минимумы

При т > п по меньшей мере т – п уравнений системы являются избыточными. После устранения избыточности количество независимых уравнений в системе становится равным т ( п). Если т = п, решением является Ф = 0. При этом точка Ф не имеет допустимой окрестности, и, следовательно, пространство решений задачи состоит из единственной точки. Такая ситуация является тривиальной. Ситуацию, когда т < п, рассмотрим подробно.

Пусть Ф =(Y, Z), где Y = (y₁, y₂, …, y_m) называются зависимыми, а Z = (z₁, z₂, …, z_n_–_m) называются независимыми переменными целевой функции W(Ф). Переписывая градиенты функций W и g в новых обозначениях, получим

W(Y, Z)= (_YW, _ZW), g (Y, Z)= (_Yg, _Zg),

где _YW, _ZW, _Yg, _Zg – скорости изменения функций W и g по зависимым (Y) и независимым (Z) переменным соответственно.

Введем в рассмотрение матрицы

J=_Yg=,C=_Zg=,

Матрица J_m__m, называется матрицей Якоби, a C_m_₍_n_–_m₎ — матрицей управления. Матрица Якоби J предполагается невырожденной. Это всегда можно обеспечить, поскольку т рассматриваемых уравнений являются независимыми по определению. Поэтому компоненты вектора Y можно выбрать среди компонентов вектора Ф таким образом, что матрица J окажется невырожденной.

Исходную систему уравнений с неизвестными W(Ф) и Ф можно переписать в следующем виде:

W(Ф)–W(Ф)Ф=0 W(Ф)=W(Ф)Ф W(Y, Z)=_YWY+ _ZWZ,

g(Ф)Ф =0  _YgY + _ZgZ = 0  JY + CZ = 0  JY = – CZ.

Так как матрица J невырожденная, существует обратная матрица J^–1. Следовательно,

Y= – J^–1CZ.

Подставляя это выражение Y в уравнение для W(Y, Z), можно выразить W через Z в следующем виде:

W(Y, Z)=_YWY+_ZWZ=_ZWZ+_YW(– J^–1CZ) 

W(Y, Z)=(_ZW – _YWJ^–1C) Z.

Из этого уравнения получаем формулу для производных функции W по вектору независимых переменных Z:

= _Z W – _Y WJ^–1C,

где _СW представляет вектор приведенного градиента функции W по Z. Следовательно, вектор _СW(Y, Z) должен обращаться в нуль в стационарных точках.

Достаточные условия экстремума в стационарной точке изложены в параграфе 3.1. В этом случае элементы матрицы Гессе будут соответствовать компонентам вектора независимых переменных Z. Между тем элементы матрицы Гессе должны быть приведенными вторыми производными. Чтобы показать, как они вычисляются, обозначим

 =_YWJ^–1.

Тогда: _СW =_ZW – С.

Отсюда следует, что i-й строкой приведенной матрицы Гессе является вектор скорости изменения вектора приведенного градиента _СW по i-й независимой переменной z_i _СW/z_i:

Заметим, что  — функция от Y, а Y, в свою очередь, — функция от Z. Следовательно, при вычислении частной производной _СW по z_i, следует применять правило дифференцирования сложной функции, а именно:

1 / 71 2 3 4 5 6 7 > Следующая >>>

Соседние файлы в папке Учебники ТПР

#
17.06.2016389.12 Кб168Учебник ТПР_2.1.doc
#
17.06.2016387.58 Кб176Учебник ТПР_2.2.doc
#
17.06.2016610.82 Кб166Учебник ТПР_2.3.doc
#
17.06.201621.5 Кб118Учебник ТПР_2_страница.doc
#
17.06.2016344.06 Кб137Учебник ТПР_3.1.doc
#
17.06.2016656.9 Кб242Учебник ТПР_3.2.doc
#
17.06.2016398.85 Кб131Учебник ТПР_3.3.doc
#
17.06.2016928.77 Кб197Учебник ТПР_3.4.doc
#
17.06.2016436.74 Кб138Учебник ТПР_3.5.doc
#
17.06.2016963.58 Кб181Учебник ТПР_4.1.doc
#
17.06.20162.38 Mб206Учебник ТПР_4.2.doc