
Информатика 2 сессия / Численные методы решения задач строительства на ЭВМ
.pdf
Численные методы оптимизации
Решение задачи оптимизации состоит в нахождении значений управляемых параметров х1, х2, х3,….хn,
удовлетворяющих заданным ограничениям и обращающим в максимум или минимум целевую функцию.
Решение может находиться либо внутри области, либо на границе. Если целевая функция непрерывна, а множество
замкнуто, не пустое и ограниченное, то решение задачи
(8.1) – (8.3) существует.
8.1.2. Необходимые и достаточные условия экстремума функции
Выбор метода решения задачи оптимизации зависит от свойств целевой функции и той информации о ней, которая может считаться доступной в процессе решения задачи. Наиболее просты с математической точки зрения случаи, когда целевая
функция формулируется в терминах непрерывных параметров и задается аналитической формулой. А если при этом она еще является и дифференцируемой, то для ее исследования (поиска точек локального экстремума, определения направления ее возрастания и убывания) может быть использована производная.
Локальный экстремум – это точка Х * пространства проектирования, в которой целевая функция имеет наибольшее
или наименьшее значение по сравнению с ее значениями в других точках ближайшей окрестности.
Необходимым |
признаком |
локального |
экстремума |
|||
функции в |
точке Х * |
является равенство нулю |
всех |
частных |
||
производных в этой точке [33]: |
|
|
|
|||
|
∂Z(X * ) |
= 0 , (i = 1,2,…,n). |
|
(8.4) |
||
|
∂xi |
|
|
|||
|
|
|
|
|
|
|
Точка |
Х * при |
|
выполнении |
необходимого |
условия |
|
называется стационарной точкой. |
|
|
|
263

Численные методы оптимизации
Глобальным экстремумом называют точку, в которой целевая функция имеет наибольшее (наименьшее) значение среди всех локальных экстремумов области определения.
Рис.8.1. Гиперповерхность отклика целевой функции
Функцию Z(X ) называют унимодальной
(одноэкстремальной), если она имеет один экстремум, и
мультимодальной (многоэкстремальной), если она имеет более одного локального максимума (минимума) (рис. 8.1).
С математической точки зрения целевая функция Z(X )
определяет некоторую (n+1)-мерную поверхность
(гиперповерхность), а ограничения задачи – пространство проектирования n-мерного евклидова пространства En. Здесь n – число управляемых параметров.
Например при n=1 пространством проектирования является
отрезок, а функции цели соответствует кривая на плоскости
(рис.8.2,а). При n=2 целевая функция изображается поверхностью в трехмерном пространстве, а пространство проектирования – областью на плоскости (рис.8.2,б). При n³3 – это некоторые гиперповерхности, которые невозможно изобразить обычным способом.
264

Численные методы оптимизации
z |
|
|
z |
|
|
|
|
|
|
|
z=f(x1 ) |
|
|
z=f(x1 ,x2 ) |
|
n=1 |
|
|
|
|
|
x1 |
|
x2 |
|
|
|
|
|
a |
_ |
b |
пространство |
_ |
|
S |
|
||
|
|
S |
||
|
|
|
проектирования |
|
|
a |
x1 |
_ |
б |
|
D- область допустимых |
|||
|
|
|
решений |
|
Рис.8.2. Геометрическое представление целевой функции и ограничений
Введем понятие градиента функции. Это вектор-столбец первых производных Z(X ) по всем переменным. Для удобства
запишем его в виде вектора-строки (транспонированный вектор- столбец):
é |
¶Z |
|
¶Z |
|
¶Z |
ù |
|
|||
ÑT Z(X ) = ê |
, |
,..., |
ú . |
(8.5) |
||||||
¶x |
¶x |
|
¶x |
|
||||||
ë |
|
2 |
|
n û |
|
|||||
1 |
|
|
|
|
|
Доказано [21], что градиент скалярной функции направлен в сторону наискорейшего увеличения функции (наискорейшего подъема).
Вектор, противоположный этому градиенту (отрицательный градиент или антиградиент), направлен в сторону
наискорейшего уменьшения функции (наискорейшего спуска).
Характер экстремума функции (максимум или минимум) в
стационарной точке определяется исследованием поведения
функции Z(X ) в окрестности точки Х * . Для этого формируется
матрица вторых производных целевой функции Н по управляемым параметрам (матрица Гессе – гессиан):
265

Численные методы оптимизации
é |
¶2 Z |
, |
|
¶2 Z |
|
, |
L, |
¶2 Z |
ù |
|
||||||
ê |
¶x2 |
|
|
|
|
|
ú |
|
||||||||
|
¶x ¶x |
2 |
¶x ¶x |
|
|
|||||||||||
ê |
1 |
|
|
1 |
|
|
|
|
|
1 |
|
n ú |
|
|||
ê |
¶2 Z |
|
, |
¶2 Z |
, |
|
|
L, |
|
¶2 Z |
ú |
|
||||
Ñ2 Z(Х ) = H = ê |
|
|
¶x2 |
|
|
|
|
|
|
|
ú |
(8.6) |
||||
¶x ¶x |
2 |
|
|
|
¶x |
2 |
¶x |
|
||||||||
ê |
1 |
|
2 |
|
|
|
|
|
|
|
n ú |
|
||||
ê |
L |
|
|
L |
|
|
|
L |
L |
ú |
|
|||||
ê |
¶2 Z |
|
, |
¶2 Z |
|
|
, |
L, |
¶2 Z |
ú |
|
|||||
ê |
|
|
|
|
|
|
|
|
ú |
|
||||||
¶xn¶x1 |
¶xn¶x2 |
|
¶xn2 |
|
||||||||||||
ë |
|
|
|
|
|
û |
|
|||||||||
Если она определена положительно, то |
в |
точке Х * |
||||||||||||||
функция Z(X ) имеет безусловный |
|
|
минимум, если |
определена |
отрицательно – безусловный максимум. Эти условия являются
достаточными условиями экстремума функции.
В остальных случаях точка Х * является седловой точкой.
На практике проверка характера стационарной точки проводится в простых случаях, когда известно, что функция непрерывна и не менее чем дважды дифференцируема.
Поиск максимума целевой функции ( Z(x) → max ) всегда можно заменить на поиск минимума этой же функции, но взятой с обратным знаком (–Z(x) → min ) (рис.8.3).
z |
|
z=z(x) |
|
max |
|
|
x |
min |
z=-z(x) |
Рис.8.3. Максимум и
минимум функции
Если целевая функция задана аналитически, то для вычисления
градиента можно получить явные формулы. В тех случаях, когда никакой формулы для целевой функции нет, а
имеется лишь возможность определить ее значение в любой точке рассматриваемой области (с помощью расчетов, в результате эксперимента и т.п.), частные
производные в нужных точках приходится вычислять приближенно,
заменяя их соответствующими разностными отношениями [19]:
266

|
|
|
Численные методы оптимизации |
|
|
||
∂Z |
≈ |
Z(x1 |
,..., xi |
+ xi ,..., xn ) − Z(x1 |
,..., xi ,..., xn ) |
. |
(8.7) |
∂xi |
|
|
xi |
|
|||
|
|
|
|
|
|
Отметим, что при таких расчетах xi нельзя брать слишком
малым, а значения функции нужно вычислять с достаточно высокой степенью точности, иначе при вычислении разности
Z = Z(x1 ,..., xi + xi ,..., xn ) − Z(x1 ,..., xi ,..., xn )
будет допущена большая ошибка.
8.1.3. Классификация задач математического программирования
Общие методы нахождения экстремума целевой функции
при наличии ограничений рассматриваются в разделе науки “Исследование операций”, который называется математическим
программированием. В математическом программировании целью решения является набор программ действий, которые оптимальны с точки зрения принятого критерия.
Для разных классов задач, связанных с определенными
видами целевой функции и структурой ограничений, разработаны
различные методы расчета и соответственно этим задачам в
математическом программировании выделяют следующие основные разделы (рис.8.4):
Математическое программирование
Линейное Нелинейное Целочисленное программирование программирование программирование
Квадратичное Выпуклое Геометрическое программирование программирование программирование
Рис. 8.4. Классификация задач математического программирования
267

Численные методы оптимизации
Линейное программирование (ЛП) [17], если
математическая модель состоит из линейной относительно проектных параметров целевой функции (8.1) и входящие в систему ограничения (8.2)-(8.3) также линейны.
Нелинейное программирование [21], если в
математической модели содержится хотя бы одна нелинейная зависимость. В нелинейном программировании традиционно выделяют разделы, имеющие специальную структуру
(квадратичное, выпуклое, геометрическое программирование).
Кквадратичному программированию [21] относят задачи
сквадратичной целевой функцией и линейными ограничениями.
Выпуклое программирование [17] исследует выпуклые целевые функции и ограничения задачи.
Геометрическое программирование [23] исследует оптимизационные задачи, в которых целевая функция и левые части ограничений представляют собой обобщенные многочлены,
апеременные должны быть положительными.
Внекоторых практических задачах переменные или какая- то их часть должны принимать целые значения. Такие задачи рассматриваются в разделе целочисленное программирование [2, 21].
Методы решения задач математического программирования имеют свою специфику в отличие от методов классического анализа отыскания экстремумов функций, так как даже в наиболее
простых задачах линейного программирования экстремум достигается в угловых точках границы области допустимых решений, т.е. там, где нарушается дифференцируемость функций. Да и в нелинейных задачах, в связи с наличием ограничений,
оптимальное значение целевой функции нередко достигается не там, где имеется нулевой градиент, а соответствует одной из границ области проектирования. При этом, в практических задачах число переменных и ограничений обычно столь велико, что если просто перебирать все точки, "подозреваемые" в экстремальности, то вряд ли даже ЭВМ справится с такой задачей.
268

Численные методы оптимизации
8.2. Постановка задачи оптимального проектирования
Постановка задачи оптимального проектирования ведется с учетом назначения реального объекта, целей проектирования и конкретных условий реализации проекта. Чаще всего
специалистам строительной отрасли приходится решать задачи оптимизации, связанные с процессом проектирования
технических объектов или управления в сфере организационно- хозяйственной или экономической деятельности.
Далее под проектированием мы будем понимать процесс создания проекта не только архитектурно-строительного объекта или конструкции, но и трудовых, экономических процессов, процесса управления предприятием (фирмой).
Процесс проектирования имеет целью получение
оптимального объекта, имеющего возможные наилучшие свойства: минимальный вес, минимальную стоимость, максимальную энерговооруженность, максимальную прибыль минимум капиталовложений и т.п.
Постановка задачи оптимального проектирования носит неформальный характер и включает следующие этапы:
∙определение входных (управляемых) и выходных (переменных состояния) параметров;
∙выбор целевой функции;
∙назначение ограничений;
∙нормирование управляемых и выходных параметров.
8.2.1. Определение входных и выходных параметров
Входные (внутренние) параметры, значения которых могут
меняться в процессе оптимизации и которые являются
аргументами целевой функции, называют управляемыми (или
проектными) параметрами. Значения некоторых входных параметров назначаются и не подлежат изменению. К таким параметрам, например, можно отнести параметры
269

Численные методы оптимизации
унифицированных элементов или те из них, значения которых
оговорены в ТЗ Качество функционирования любой системы характеризуется
множеством выходных параметров Y = (у1, у2, ...,уk) или
критериев эффективности [20]. Среди выходных параметров одна их часть может быть измерена количественно, другая часть представляет собой качественную сторону объекта. Поэтому все
выходные параметры обычно делятся соответственно на
количественные и качественные.
Качественные критерии могут принимать только два значения: 1 или 0. Это может быть, например, разрушение или неразрушение сооружения, прием или неприем на работу какого- то сотрудника. В таких случаях обычно используют вероятностный подход, т.е., выбирают показатель
эффективности в виде вероятности достижения желаемого результата. Например, если А – событие, состоящее в том, что цель достигнута, то показатель эффективности Р(А) есть вероятность события А. Таким образом, совершается переход к более достижимой цели – вероятности выполнения задачи и
соответственно к количественному описанию критерия эффективности.
В дальнейшем под вектором Y будем подразумевать вектор
количественных параметров.
Содержание типичного технического задания (ТЗ) на
проектирование включает в себя конкретные числовые требования к основным выходным параметрам (технические требования). Это могут быть конкретные числовые данные,
характеризующие условия сопряжения системы с внешней средой (диапазоны изменения внешних параметров: напряжений, перемещений, температуры, влажности; условия функционирования системы и пр.); качественное описание требований, ограничений и условий, не поддающихся непосредственно количественной оценке.
Требуемые соотношения между выходными параметрами и техническими требованиями (ТТ) иногда называют условиями работоспособности и записывают в виде [20]
270

Численные методы оптимизации |
|
yi<TTi, i [1:k], |
|
yj>TTj, j [k+1:l], |
(8.8) |
yr=TTr±Δyr, r [l+1:m], |
|
где yr – допустимое отклонение r-го выходного параметра от указанного в ТЗ значения TTr.
Условия работоспособности обычно имеют определяющее значение в задачах проектирования.
Обоснованный вывод о том, насколько удачно то или иное техническое решение, может быть сделан, только когда определены значения всех входных параметров, построена
математическая модель и выполнены расчеты по определению
выходных параметров и условий работоспособности.
После вычислений выходных параметров может оказаться,
что условия работоспособности не выполняются и необходимо провести повторный выбор значений внутренних параметров, т.е.
выполнить вариантный анализ.
8.2.2. Выбор целевой функции
Формирование целевой функции (8.1) всегда выполняется с
учетом различных выходных параметров проектируемого объекта.
Целевая функция количественно выражает качество объекта, и потому ее иногда называют также функцией качества или критерием оптимальности. Все последующие действия направлены на поиск объекта, наиболее близкого к оптимальному по выбранному критерию.
Целевая функция должна быть одна (принцип однозначности). Однако в большинстве реальных задач проектирования преследуется, как правило, не одна, а несколько целей (многокритериальность) [39], которые зачастую имеют противоречивый характер, улучшение одного из них приводит к ухудшению другого, так как все они являются функциями одних и
271

Численные методы оптимизации
тех же управляемых параметро, и не могут изменяться независимо друг от друга.
Например, проектировщик желает, чтобы его проектируемое предприятие обеспечивало максимальную прибыль, имело минимальные капиталовложения, максимальную технологичность, минимальные энергетические затраты и т.п
Поэтому практически всегда возникает задача объединения критериев. Сведение многокритериальной задачи к однокритериальной называют сверткой векторного критерия [2, 20].
В зависимости от того, каким образом выбираются и объединяются выходные параметры в функции цели, различают
частные, аддитивные, мультипликативные, минимаксные и др.
критерии. Рассмотрим некоторые способы объединения (свертывания) критериев.
Частные критерии – наиболее часто используемые в задачах оптимизации. Они могут применяться в случаях, когда
среди выходных параметров можно выделить один основной параметр уi (X ) , наиболее полно отражающий эффективность
проектируемого объекта. Этот параметр принимают за целевую функцию (8.1).
Примерами таких параметров могут быть: стоимость проекта,
вес конструкции, производительность и т.п.
Условия работоспособности всех остальных выходных параметров объекта относят при этом к функциональным ограничениям. Оптимизация на основе такой постановки называется оптимизацией по частному критерию.
Достоинство такого подхода – его простота, существенный недостаток – то, что большой запас работоспособности можно получить только по основному параметру, который принят в качестве целевой функции, а другие параметры вообще не будут иметь запасов.
Взвешенный аддитивный критерий [20] применяют тогда, когда условия работоспособности (8.8) позволяют выделить
272