
Информационные системы менеджмента - Бажин И.И
..pdfГлава 7. Стратегия решения задач оптимизации |
381 |
Недифференцируемость функций в модели
Наиболее часто недифференцируемость функций в модели, содержащей аналитические выражения, возникает в двух случаях: 1) условные операторы приводят к различным выражениям; 2) работа некоторых блоков модели зависит от значений выбранных переменных или функций, а также минимаксных опера торов. Такого рода недифференцируемость вызывает принципиальные трудно сти, так как вычисление градиентов приходится производить в окрестностях то чек переключения условного или минимаксного оператора. Если 5 - приращение при дифференцировании, то в точке х° + 8 вычисляется значение одной функ ции, а в точке х°, возможно, придется вычислять значения другой функции. В связи с этим невозможно точно вычислить значение градиента. Такие принципи альные трудности иногда преодолеваются либо увеличением точности вычис лений, либо заменой минимаксных операторов системой неравенств. Но все же при наличии в модели большого числа условных выражений целесообразно не применять методы поисковой оптимизации, в алгоритмах которых используются значения градиентов функций.
Недопустимые значения аргументов функций
Часто упускается из виду, что простая причина остановки счета на компью тере при решении оптимизационных задач связана с неконтролируемым выхо дом значений аргументов функций за пределы допустимой области. Например, часто используемые функции вида [g(x)]b или log[g(x)] приводят к прекращению счета, когда в оптимизационном поиске д(х) принимает отрицательное или ну левое значение. Для предотвращения таких случаев в модель вводится допол нительное ограничение вида д(х) > е > О, где 8 - малая величина. При предва рительном анализе модели важно дополнить ее такими чисто математическими ограничениями, предотвращающими неконтролируемый останов счета.
В задачах, где переменные по содержательному смыслу являются неотри цательными числами, важным является отразить это обстоятельство в специ альных ограничениях Xj > 0, что гарантирует изменение искомых параметров в допустимой области. Именно игнорирование таких ограничений, обусловленное тем, что "это само собой разумеется", является частой ошибкой, вызывающей определенные трудности в решении оптимизационных задач.
Повышение эффективности решения
Следует отметить, что сложность решения нелинейных задач экспоненци ально возрастает с увеличением количества переменных или ограничений в ви де равенств и неравенств. Как правило, при наличии линейных ограничений встречается меньше трудностей, чем с нелинейными, а при наличии ограниче ний в виде неравенств - меньше, чем с ограничениями-равенствами. Поэтому на стадии подготовки задачи к решению целесообразно модифицировать модель с целью уменьшения количества ограничений, особенно нелинейных, и количест ва переменных. Модель можно улучшить с помощью преобразований функций и переменных, исключением лишних ограничений, а также используя метод по следовательной подстановки.
382 |
Часть 1. Новые принципы работы |
Преобразование функций
Под преобразованием функций понимается любое алгебраическое преобра зование функции или объединение данной функции с какой-либо другой. Для повышения эффективности решения задачи обычно проводятся преобразова ния, которые позволяют заменить нелинейные ограничения линейными, а ра венства - неравенствами. Например, легко преобразовать нелинейное ограни чение у ~1д(х) = Ь, где д(х) - линейная по х функция, в линейное ограничение, умножив обе части на у: д(х) - by = 0.
Преобразование переменных
Другой способ повышения эффективности поиска - это преобразование пе ременных. При этом возможно исключение или упрощение ряда ограничений. Например, преобразование вида Xj = у;2 может быть использовано для замены переменной Xj и условия неотрицательности Х| > 0.
Следует, однако, иметь в виду, что при такого рода заменах переменных возможны осложнения, вызываемые появлением дополнительных локальных оптимумов, ослаблением сходимости и вырождением выпуклости функций. Так что к заменам переменных, несмотря на кажущееся повышение эффективности поиска, следует подходить с осторожностью.
Исключение избыточных ограничений
Другим средством упрощения поиска является исключение из задачи избы точных ограничений. Избыточными являются ограничения, которые не исполь зуются при определении границ допустимой области значений переменных. На пример, в задаче имеются обычные неравенства
x<i < а и X! < Ь, где b > а > 0
Поскольку второе неравенство перекрывается первым, в нем нет необходимости для определения границ допустимых значений Хч и его можно исключить. Хотя избыточные ограничения, как правило, можно легко распознать, в общем случае неизвестно ни одной процедуры для их идентификации; такие процедуры име ются лишь для линейных ограничений.
Метод последовательной подстановки
Размерность и число ограничений в виде равенств можно существенно со кратить, решая явно или неявно некоторые из них и используя полученные ре шения для исключения переменных (путем подстановки), как это отмечалось в разделе 6.4.2. Процедура сводится к выбору множества независимых перемен ных и определению такого порядка решения ограничений в виде равенств отно сительно независимых переменных, при котором потребуется минимально воз можное число итераций. В редких случаях удается исключить все ограничения в виде равенств и не проводить итеративного решения. Обычно остается ряд ог раничений, которые нельзя непосредственно решить относительно одной или большего числа зависимых переменных.
Глава 7. Стратегия решения задач оптимизации |
383 |
7.3. МЕТОДЫ ГЛОБАЛЬНОЙ ОПТИМИЗАЦИИ
Как уже отмечалось, практически все алгоритмы методов оптимизации при способлены для отыскания локального минимума функции. Для надежной опти мизации моделей, которые могут иметь несколько локальных минимумов, сле дует воспользоваться несколькими методами решения задачи, чтобы найти гло бальный минимум. Отыскать глобальный минимум желательно не только в свя зи с тем, что это лучшее возможное решение задачи, но также и потому, что ло кальный минимум может привести к неправильным оценкам результатов расче тов по определению влияния переменных модели. Если одному множеству зна чений параметров, например, обозначающих стоимость, соответствует один ло кальный минимум, а другому множеству значений параметров соответствует другой локальный минимум, то становится затруднительным точно определить влияние изменения числовых значений параметров модели на решение, по скольку решение меняется из-за попадания в различные локальные оптимумы. Этих трудностей можно избежать, если во всех случаях найдены глобальные оптимумы.
Методы поиска глобального оптимума являются в настоящее время пред метом интенсивных исследований. Известные методы поиска делятся на детер минированные и стохастические, которые, в свою очередь, могут быть эвристи ческими или строго обоснованными. Простейший и наиболее широко исполь зуемый метод состоит в проведении ряда оптимизационных расчетов при раз личных начальных условиях. Иногда этот метод называют методом с несколь кими начальными точками. В этом методе начальные точки выбираются из оп ределенной решетки (множества точек) или генерируются случайным образом. В первом случае допустимая область разбивается на непересекающиеся по добласти, и оптимизация выполняется в каждой такой подобласти по отдельно сти. Во втором случае начальные точки выбираются случайным образом с рав номерным распределением поля рассеяния. В обоих случаях в качестве гло бального оптимума из всех найденных локальных минимумов принимается ло кальный минимум с самым минимальным значением целевой функции.
Оба эти метода эвристические. В первом случае разбиение на непересе кающиеся подобласти производится произвольно, поэтому нет уверенности в том, что в каждой подобласти имеется только один локальный минимум. Во вто ром случае нет уверенности, что начальные точки распределены так, что каждая из них находится в окрестности только одного из локальных минимумов. С рос том числа различных стартовых точек повышается вероятность того, что не пропущен ни один локальный минимум. Это, однако, достигается ценой сущест венного увеличения объемов оптимизационных расчетов.
В практических исследованиях глобальный минимум находится методом случайного выбора стартовых точек, причем сначала следует предположить, ка кого количества начальных точек достаточно, чтобы наверняка получить гло бальное решение. Несмотря на трудность повторных расчетов, этот метод сле дует использовать в тех случаях, когда предполагается существование несколь ких локальных минимумов.
384 |
Часть 1. Новые принципы работы |
7.4.ОЦЕНКА АДЕКВАТНОСТИ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ
Оптимизационное исследование не заканчивается получением решения за дачи. Напротив, самая важная часть исследования заключается в обосновании правильности решения. Наиболее важным является не само полученное реше ние, а информация о состоянии системы в окрестности решения, что позволяет глубже понять ее основные свойства.
Опытный руководитель, использующий при решении задач менеджмента методы математического программирования, редко довольствуется лишь чис ленными значениями управляемых переменных, при которых достигается опти мум, если та или иная модель не применялась им многократно и, следователь но, диапазон ее возможностей заранее не известен. В большинстве же случаев руководителю необходимо знать, в каком интервале можно менять входные па раметры без существенного нарушения структуры базиса, формирующего оп тимальное решение.
Первое, что необходимо сделать при исследовании результатов оптимиза ционных расчетов, - установить, обоснованно ли полученное решение. Считает ся, что решение обоснованно, если ему соответствует некоторое реализуемое состояние проектируемого объекта, и это состояние является его оптимумом. Реализуемое состояние - это одно из возможных состояний системы. Как пра вило, если модель достаточно точно отражает поведение объекта проектирова ния, она (то есть, модель) содержит необходимые ограничения и границы. Это позволяет получить математическое решение, которое всегда отражает физиче ски реализуемое возможное состояние объекта проектирования. Однако все мо дели верны лишь в определенных пределах, все зависимости справедливы в некоторых границах, а вся информация имеет ограниченную точность.
Следует проверить, не выходит ли полученное решение за границы досто верности модели. Если это обнаружено, то необходимо ввести в модель допол нительные ограничения и повторить оптимизационные расчеты.
Оценка адекватности разработанных математических моделей в полной ме ре может быть осуществлена экспериментальной проверкой всех компонентов модели или, по крайней мере, тех ее компонентов, которые содержат зависимо сти, ранее не подвергавшиеся экспериментальной проверке.
Вместе с тем, положительной особенностью операционных математических моделей является то обстоятельство, что область оптимального решения вы деляет из гиперпространства, определяющего множество допустимых значений варьируемых параметров, подпространство, в котором лишь часть ограничений имеет влияние на полученное решение, а остальные заведомо выполняются, перекрываясь более жесткими (в области оптимума) ограничениями, называе мыми активными. Эта особенность позволяет оценивать адекватность матема тической модели лишь по отношению именно к этим активным ограничениям, не заботясь о высокой точности определения зависимостей, выражающих ограни чения, не попавшие в число активных. Указанное обстоятельство позволяет ис пользовать для оценки адекватности математических моделей анализ чувстви-
Глава 7. Стратегия решения задач оптимизации |
385 |
тельности этих моделей, то есть оценку чувствительности оптимального реше ния к изменениям параметров, входящих в модель, или к изменениям исходных данных.
Такой анализ чувствительности позволяет определить влияние на опти мальное решение вариаций неточно заданных параметров. Значения некоторых параметров модели могут быть известны с заведомой погрешностью (в различ ных инвестиционных проектах к таким параметрам, например, могут относиться характеристики используемых материалов, данные о геологии строительной площадки, данные о розе ветров, температурах климатической зоны и т.п.). Анализ чувствительности показывает, стоит ли проводить исследования для оп ределения более точных значений этих параметров. В процессе исследования чувствительности может выясниться, что параметры модели, функциональные ограничения, которые представлялись до решения задачи весьма важными, не оказывают большого влияния на результаты оптимизации, и поэтому нет необ ходимости уточнять их значения.
Кроме того, анализ чувствительности дает возможность оценить необходи мость модификации проектируемого объекта с целью улучшения его показате лей качества, так как выявляет именно те ограничения и параметры, которые ак тивно препятствуют достижению более высоких значений показателя эффектив ности. Такая информация позволяет исследователю внести в содержание про екта эффективные изменения (совершенствование структуры компонентов, за мена материалов и т.п.), позволяющие обойти сдерживающие (активные) огра ничения.
Положительные особенности операционных математических моделей и ис пользование для автоматизации синтеза параметров проектируемого объекта поисковых методов оптимизации дают возможность проведения анализа чувст вительности моделей непосредственно на основе вычислений, производимых в процессе поиска решения, поскольку в подавляющем большинстве разработан ных вычислительных процедур методов оптимизации, помимо получения опти мального решения, производится вычисление в оптимальной точке множителей Лагранжа, с помощью которых успешно осуществляется оценка чувствительно сти (а вместе с тем и адекватности) математической модели.
В решении задач оптимизации множители Лагранжа рассматриваются обычно как параметры, значения которых выбираются таким образом, чтобы выполнялись ограничения задачи. Вместе с тем, как доказывается в специаль ной литературе, с экономической точки зрения множители Лагранжа интерпрети руются как неявные цены ресурсов, определяемых ограничениями, и в такой по становке множители Лагранжа играют важную роль в анализе чувствительности решений. При этом такая интерпретационная схема обычно рассматривается для ограничений, представленных в классическом виде «ограничения ресурсов»
^ ( X L х2 ,..., х„) = bkj |
k = 1,2,3,...,K, |
(7.1) |
где постоянная bk характеризует наличие некоторого ресурса. Физический смысл каждой константы bk определяется в каждом случае содержательной сутью за-
386 Часть 1. Новые принципы работы
дачи (ограничения массы, стоимости, мощности, габаритных размеров и т.п.). Для ограничений вида (7.1) показано, что оптимальные значения множите
лей Лагранжа характеризуют скорость изменения оптимального значения целе
вой функции f°, вызываемого изменением bk , т.е. |
|
|
af°/abk = ^0k, |
к = 1,2,з,...к |
(7.2) |
Иными словами, величина изменения оптимального значения целевой функции, обусловленного единичным увеличением правой части k-го ограниче ния (ресурса) задается множителем Лагранжа A.V
Распространение использования множителей Лагранжа с помощью теоремы Куна-Таккера на случай общей задачи математического программирования с ог раничениями как в виде равенств, так и в виде неравенств приводит к системе уравнений
д(1дхл |
- Ец(5д/ах1) - SA,k3hk/dxi = О, |
|
dfldx2 |
- Щ{дд11дх2) - £A.kdhk/dX2 = О, |
|
dfldxz |
- Ец(бд/5хз) - EA.kdhk/ax3 =0, |
(7.3) |
dfldxn- |
ЕиДдд/дХп) - E?ikc>hk/c>Xn = 0, |
|
где gj - ограничения-неравенства, Uj - соответствующие им множители Лагран жа;
hk - ограничения-равенства, A.k - соответствующие этим ограничениям множите ли Лагранжа.
При этом для активных ограничений-неравенств, выполняемых в точке оп тимального решения в виде равенств gj = 0, множители Лагранжа ц > 0, а для неактивных ограничений (gj > 0) выполняются условия дополняющей нежестко сти Ujgj = 0, то есть, для этих ограничений Uj = 0.
Следует отметить, что если существует возможность до непосредственного решения задачи обнаружить ограничения, которые неактивны в точке оптимума, то эти ограничения можно исключить из модели, и тем самым уменьшить ее размер. Основная трудность заключается при этом в предшествующей решению идентификации неактивных ограничений. Кроме того, неактивные в точке опти мума ограничения играют определенную немаловажную роль в процессе поиска точки оптимума, выделяя гиперпространство допустимых значений параметров.
Анализ операционных математических моделей различных реальных объ ектов показывает, что лишь часть ограничений может быть представлена в классическом виде явного «ресурсного ограничения» (7.1), содержащего в пра вой части «ресурсную» константу bk .
Вместе с тем, можно утверждать, что значительная часть ограничений, со держащихся в моделях, выражают собой ресурсы, в которых «ресурсная» кон станта не может быть явно выделена в виде отдельного аддитивного члена, а входит в аналитическое выражение ограничения в виде сомножителя, показате-
Глава 7. Стратегия решения задач оптимизации |
387 |
ля степени, содержится под радикалами, в трансцендентных выражениях. Бо лее того, в одном ограничении может содержаться несколько констант, имею щих смысл ресурсных. К таким ограничениям могут быть отнесены многие из ус ловий прочности различных объектов, долговечности, геометрические ограниче ния, отражающие ресурс геометрии данной схемы объекта и т.п. Для таких ог раничений приводимая в литературе оценка чувствительности в виде (7.2) ока зывается неприемлемой.
Обобщим задачу анализа чувствительности операционных моделей на слу чай ограничений, представленных в самом общем виде. Рассмотрим без нару шения общности лишь ограничения-неравенства, поскольку в точке оптимума активные ограничения выполняются как равенства.
9J(XI, х2 хП; Ьл, bj2 bJK...,bjm) > 0, |
k = 1,2,3, ... , m |
(7.4) |
Изменения f° (оптимального значения f), обусловленные изменениями кон станты bJk (j - номер ограничения, к - номер константы в этом ограничении), описываются частной производной 5f°/5bjk По правилу дифференцирования сложной функции
df°/dbjk = Zdfldx^dx^ |
|
ldbik |
(7.5) |
Дифференцируя обе части ограничения (7.5) |
по bjk, получим |
|
|
ag/dbjk + E6gj/5x0i.ax0i/abjk = 0 |
(7.6) |
||
Умножим обе части равенства (7.6) на и0,- и вычтем из (7.5) |
|
||
df°ldbik = - u°j dgj/dbjk + E[df°/dx°i - |
и ^ д ^ х ^ З х " /5bjk |
(7.7) |
Так как х°, и u°j являются решением задачи оптимизации и, следовательно, удовлетворяют условиям Куна-Таккера, совпадающим с условиями оптимально сти первого порядка, то выражение в квадратных скобках под знаком суммы об ращается в ноль. Тогда равенство (7.7) приводится к виду
df°/abj k =-u0 jSg/5 b JK |
(7.8) |
Таким образом, из формулы (7.8) следует, что скорость изменения опти мального значения f° , вызываемого изменением ресурсной константы bjk, про порциональна частной производной соответствующего ограничения по этой кон станте. При этом коэффициентом пропорциональности является оптимальное значение множителя Лагранжа, отвечающего рассматриваемому ограничению.
Полученное выражение (7.8) является обобщением, позволяющим получить оценку чувствительности модели для любого вида ограничений. Можно видеть,
388 Часть 1. Новые принципы работы
что в частном случае, когда ограничение представлено в классическом виде ог раничения ресурса (7.1), выражение (7.8) совпадает с формулой (7.2), так как в этом случае 9gj/5bjk= - 1 .
Таким образом, изменение значения целевой функции в зависимости от из менения ресурсных констант ограничений может быть выражено следующим
уравнением |
|
Af° = I2df°/c>bjkAbjk = - EIu 0 j 5gj/abjkAbjk |
(7.9) |
Следует отметить, что эта оценка изменения оптимального значения целе вой функции оказывается достаточно правильной при условиях, что приращения констант достаточно малы, в оптимуме сохраняется влияние ограничений, и од новременно возмущения получают лишь константы небольшого числа ограни чений.
Контрольные вопросы и задания
1.Какие трудности могут возникать при практической реализации оптимизацион ных расчетов?
2.Какими методами можно преодолеть вычислительные трудности при решении задач оптимизации?
3.Покажите на примерах возможные последствия несоответствия между значе ниями функций и их производных.
4.Какие могут быть случаи недифференцируемости функций в моделях, и как эти трудности преодолеваются?
5.Каковы способы повышения эффективности решения оптимизационных за дач? Приведите примеры.
6.Что такое глобальная оптимизация, и какие методы глобальной оптимизации используются на практике?
7.Каковы способы оценки адекватности математической модели?
8.Каким образом анализ чувствительности модели может быть использован в оценке ее адекватности?
Часть 2. ПРАКТИКА НОВЫХ ТЕХНОЛОГИЙ МЕНЕДЖМЕНТА
Глава 8. Компьютерные модели в оптимальном управлении
Глава 9. Информационные технологии в управлении персоналом
Глава 10. Задачи формирования информационной среды города
Глава 11. Организация информационных потоков в базах данных