- •(КубГту)
- •Методы и модели оценки опасностей техносферы
- •280102 – Безопасность технологических процессов и производств
- •Введение
- •Раздел 1. Методологические основы системного анализа и синтеза.
- •Тема 1. Системный подход.
- •Раздел 2. Линейное моделирование.
- •Тема 2. Моделирование природоохранных мероприятий.
- •1. Задачи линейного программирования
- •Раздел 4. Теория массового обслуживания.
- •Тема 4. Использование теории массового обслуживания в процессе моделирования.
- •Раздел 5. Сетевое планирование управления.
- •Тема 5. Сетевые графики.
- •Раздел 6. Экспертные системы.
- •Тема 6 Использование экспертных систем в при моделировании опасностей в техносфере.
- •Литература
- •Методы и модели оценки опасностей техносферы
Раздел 2. Линейное моделирование.
Тема 2. Моделирование природоохранных мероприятий.
Занятие 1.Линейные модели природоохранных мероприятий.
Учебные вопросы:
Задачи линейного программирования.
Основная задача линейного программирования.
3. Общая постановка задачи ДП. Принципы решения.
Время: 2 часа
Литература:
Е.С. :Вентцель Исследование операций М. Сов. Радио, 1972 стр 28-115
Ю.М. Коршунов Математические основы Кибернетики. М., Энергоиздат, 19В7 стр 2В2-306
1. Задачи линейного программирования
Многие проблемы ПОД характеризуются следующими особенностями :
- показатель эффективности W представляет собой линейную функцию от элементов решения x1,x2, ...;
- ограничительные условия, налагаемые на возможные решения, имеют вид линейных равенств или неравенств.
Такие задачи принято называть задачами ЛП, используемые модели - линейными.
Приведём несколько примеров задач ЛП из разных областей ПОД.
А. Минимизация выбросов при ограничении затрат на реконструкцию НПЗ.
Пусть в заданном регионе расположены 4 объекта НПП: 31, 32, 33, 34, ежесекундно выбрасывающих ai (i=1,2,..., n) аэрозолей, состав которых для простоты будем считать одинаковым. На каждом объекте проводятся мероприятия Cj (j=l, 2,..., к) по охране окружающей среды, стоимость каждого из них равна С1,С2,СЗ,С4. В регионе выделено Sξ (ξ=1, 2,...,m) экологических зон, для каждой из которых заданы предельно допустимые концентрации выпевшего за интервал времени аэрозоля:
Для зоны S1 не более b1 единиц
Для зоны S2 не более b2 единиц
Для зоны Sз не более bз единиц
Назовем эти выражения как (1).
Обозначим через xl, x2, x3, x4 - среднегодовые значения времени выброса загрязняющих веществ в атмосферу предприятиями региона.
Таким образом, завод 31 выбрасывает в единицу времени а11 аэрозолей, выпадающих в зоне S1, a12 аэрозолей, выпадающих в зоне S2, а13 аэрозолей, выпадающих в зоне Sз. Данные сведём в таблицу 1.
Таблица 1
|
|
Экологические зоны |
|
||
|
S1 |
S2 |
S3 |
|
|
Заводы нпп |
31 |
a11 |
a12 |
a13 |
|
32 |
a21 |
a22 |
a23 |
|
|
33 |
a31 |
a32 |
a33 |
1 |
|
34 |
a41 |
a42 |
a43 |
1 |
|
Задача состоит в том, чтобы найти такую совокупность допустимых выбросов аэрозолей, которая обеспечивала бы среднегодовые предельно-допустимые дозы аэрозольного загрязнения при минимальных экономических затратах на технологическую реконструкцию предприятий, связанную с ПОМ.
Запишем сформулированные условия в математической форме. Тогда aiJ - количество выбрасываемых аэрозолей, выбрасываемых соответственно на предприятиях и соответствующих экологических зонах. Очевидно, для заводов стоимость ПОМ будет:
Q=C1X1+C2X2+C3X3+C4X4 или короче
Условия загрязнения экологических зон -региона запишутся в виде:
Эти зависимости представляют собой ограничения, накладываемые на решение. Таким образом окончательно задача формируется следующим образом. Выбрать такие неотрицательные значения предельных xl, x2, x3, x4, удовлетворяющие линейным неравенствам (3) при которых линейная функция этих переменных (2) обращалась бы в минимум.
Б. Задача о производстве оборудования для природоохранных сооружений
Планируется производство сложного оборудования, каждый комплект которого состоит из п элементов Э1, Э2 , Э3, ... Эп. Заказы могут быть размещены на m разных предприятиях П1, П2, ..., Пm. В течении заданного времени Т на предприятии Пi можно изготовить aij элементов типа Эj. Приёму подлежат только полные комплекты оборудования, состоящие из набора всех элементов Э1,Э2,Э3,... Эn.
Требуется распределить заказы на предприятиях так, чтобы число полных комплектов оборудования, изготовленных за время Т, было максимально. Каждому предприятию устанавливается время на производство элементов Эj.
Обозначим xij долю времени Т, которую предприятие Пi будет уделять производству элемента Эj, Причём количество времени, затрачиваемое на производство всех элементов, выпускаемых предприятием, не должно превышать общего запаса времени Т (а <<доля>>- единицы).
Определим количество полных комплектов оборудования, которое за время Т поставят все предприятия вместе.
Общее количество элементов Эj, которое произведут все предприятия вместе будет равно:
Таким образом, при заданном плетне распределения заказов, т.е. при планируемых xij будет произведено:
- N1 экземпляров элемента Э1.;
- N2 экземпляров элемента Э2;
……………………………….
- Nn экземпляров элемента Эn;
Сколько же полных комплектов оборудования можно собрать из этих элементов? Очевидно, столько, каково минимальное из всех чисел N1,N2,...Nn.
Обозначим Z - количество полных комплектов для данного плана размещения заказов хij:
Z = min (Nj) (6)
Или с учётом (5) эту зависимость можно переписать:
Таким образом, мы приходим к следующей математической постановке задачи:
Найти такие неотрицательные значения переменных xij, чтобы выполнялись неравенства (44)и при этом обращалась в максимум функция этих переменных (7).
В этом примере критериальная функция не является линейной и задача, собственно, не относится к задачам ЛП.
Однако её легко свести к задаче ЛП следующими рассуждениями.
Так как величина Z является минимальной из всех величин
то можно напасать ряд неравенств
Величину Z можно рассматривать как новую неотрицательную переменную и решить следующую задачу.
Найти такие неотрицательные значения переменных Х11, X12...Xmn и Z, чтобы они удовлетворяли линейным неравенствам (4) и (8) и при этом величина Z обращалась в максимум.
Так как величина Z есть линейная функция новых переменных Х11, X12...Xmn и Z ; Z = 0*X11+0*X12+…+0*Xmn+1*Z
то задача сведена к задаче ЛП, путём введения лишней переменной Z, которая в первоначальной постановке задачи не фигурировала (использован принцип минимакса).
Рассмотрение подобных задач можно продолжить, однако анализ приведённых примеров подтверждает наличие общих закономерностей. В каждом из них элементы решения представляют собой ряд неотрицательных переменных Х1, X2...Xmn. Требуется так выбрать значения этих переменных, чтобы:
- выполнялись некоторые ограничения, имеющие вид линейных неравенств или неравенств относительно переменных Х1, X2...;
—некоторая линейная функция -Q тех же переменных обращалась в максимум (минимум).
Математический аппарат ЛП, изложению основных положений которого посвящены последующие вопросы лекции, предназначен специально для решения таких задач.
Может возникнуть вопрос: а нужен ли такой - аппарат? Нельзя ли, как принято в математике, просто продифференцировать Q по аргументам Х1, X2... приравняв производные к нулю и решить полученную систему уравнений?
Нет, оказывается, сделать этого нельзя, т.к. - функция Q линейна, производные от неё по всем аргументам постоянны и нигде в нуль не обращаются. Максимум-(минимум) функции Q, если он существует, достигается где-то на границе области возможных значений Х1 Х2... т. е. там где начинают действовать ограничения.
Математический аппарат ЛП и позволяет нам последовательно, в кратчайшие сроки, обследовать границы области возможных решений и найти на этих границах то решение, которое является оптимальным, т.е. такую совокупность значений Xi Х2..., при которой линейная функция Q обращается в максимум или минимум.
2. ОСНОВНАЯ ЗАДАЧА ЛП
Основная задача ставится следующим образом. Имеется ряд следующих переменных Х1 Х2... Хп. Требуется найти такие неотрицательные значения этих переменных, которые удовлетворяли бы системе линейных уравнений:
и кроме того, обращали бы в минимум линейную функцию
Q = C1*X1+C2*X2+ … + CN*XN (10)
Очевидно, случай, когда функцию Q необходимо обратить не в минимум а в максимум, легко сводится к предыдущему, если изменить знак функции и рассмотреть вместо неё выражение :
QI = -Q = C1*X1+C2*X2+ … + CN*XN
Условимся назвать допустимыми решением задачи ЛП любую совокупность переменных x1>=0, х2>=0,..., хп>=0, удовлетворяющую уравнениям (9).
Оптимальным решением будем называть то из допустимых решений, при которых линейная функция (10) обращается в минимум.
Основная задача ЛП необязательно должна иметь решение. Может оказаться, что уравнения (9) противоречат друг другу; или решение находится не в области положительных значений X1, Х2... Хп. Наконец, возможно, что допустимые решения существуют, но среди нет оптимального? функция Q в области допустимых решений неограниченна снизу. Доказательство этих положений рассматривается в специальном разделе математики - линейной алгебры.
В способах решения задач ЛП широкое применение получили геометрические и симплекс методы, их сущность и область применения будут рассмотрены на практических занятиях.
Основные положения метода ДП.
Динамическое программирование представляет собой математический метод оптимизации, специально приспособленный к многошаговым (многоэтапным) операциям. Многие мероприятия ПОД относятся к таким процессам, которые развиваются во времени и распадаются на ряд шагов (этапов).
Процесс является управляемым, на каждом шаге принимается какое-то решение, от которого зависит успех данного этапа и операции в целом. Управление процессом складывается из ряда элементарных управлений.
Рассмотрим пример естественно-многошаговой операции, Пусть планируется ПОД предприятия нефтегазового комплекса. На некоторый период времени, Т состоящий из т хозяйственных лет между Пi, i=1, 2,...,k проектами по защите окружающей среды распространяются какие-то средства К0. В процессе функционирования системы выделенные средства частично расходуются (амортизируются). Кроме того, предприятие вследствие реализации ПОМ получает некоторый доход, зависимый от вложенных средств. В начале каждого года, имеющиеся средства могут перераспределятся, между проектами ПОД.
Ставится вопрос: как нужно в начале каждого года распределить имеющиеся средства между проектами, чтобы суммарный доход от всех мероприятий ПОД за весь период Т=m был максимальным?
Пусть в начале i-ro года проекты обеспечиваются средствами соответственно Xi(1), Xi(2), …, Xi(k). Совокупность этих значении представляет собой не что иное, как управление на i-м шаге: Ui = (Xi(1), Xi(2), …, Xi(k)) (1)
Управление U ПОД в целом представляет собой совокупность всех шаговых управлений: : U = (U1, U2, …, Um) (2)
Управление может быть хорошим или плохим, эффективным или неэффективным. Эффективность управления U оценивается тем же показателем W, что и эффективность проекта в целом. В нашем примере показатель эффективности (целевая функция) представляет собой суммарный доход от всей совокупности ПОМ за m лет. Он зависит от управления U, т.е.
W = W(U) = W(U1,U2, …, Um) (3)
Возникает вопрос: как выбрать шаговые управления U1, U2, …, Um, для того, чтобы величина W обратилась в максимум?
Поставленная задача называется задачей оптимизации управления, а управление, при котором показатель W достигает максимума, - оптимальным управлением – Uopt= (U10, U20, …, Um0) (4)
где ωi>i - доход от всех проектов ПОД за i-й год.
Задачу можно решить по-разному: или искать сразу оптимальное управление Uopt, или же строить его постепенно, шаг за шагом, на каждом этапе на каждом этапе расчета оптимизируя только один шаг. Второй способ оптимизации проще, чем первый, особенно при большем количестве шагов. Причем шаговое управление должно выбираться с учетом всех его последствий в будущем.
Однако из этого правила есть исключения. Среди всех шагов существует один, который может планироваться попросту, без «оглядки на будущее». Какой это шаг? Очевидно, последний - после него других шагов нет. Этот шаг, единственный из всех, можно планировать так, чтобы он как таковой принес наибольшую выгоду.
Процесс ДП разворачивается от конца к началу: раньше всех планируется последний, m-й шаг. А как его спланировать, если мы не знаем, чем кончился последний? Очевидно, нужно сделать разные предположения о том, чем кончился предпоследний (m-1)-й шаг, и для каждого из них найти такое управление, при котором выигрыш (доход) на последнем шаге был бы максимален. Решив эту задачу, мы найдем условное оптимальное управление на m-м шаге, т.е. то действие, которое надо применить, если (m-1)-й шаг закончился определенным образом.
Предположим, что эта процедура выполнена и для каждого исхода (m-l)-гo шага мы знаем условное оптимальное управление, на m-м шаге, и соответствующий ему условный оптимальный выигрыш. Теперь мы можем оптимизировать управление на предпоследнем, (m-1)-м шаге и т.д. одним словом, на каждом шаге ищется такое управление, которое обеспечивает оптимальное продолжение процесса относительно достигнутого в данный момент состояния.
Теперь предположим, что условное оптимальное управление на каждом шаге нам известно: мы знаем, что делать дальше, в каком бы состоянии ни был процесс к началу данного шага. Тогда мы можем найти уже не «условное», а просто оптимальное управление на каждом шаге.
Действительно, пусть нам известно начальное состояние процесса, обозначим его So. Применяем, на первом шаге, условное оптимальное управление, выбранное нами для состояния So. В результате этого система перейдет в состояние S1 но для него мы опять используем условное оптимальное управление для второго шага U2opt и т.д. Таким образом, мы найдем оптимальное управления процессом Uopt = (U10, U20, …, Um0), приводящее к максимально возможному выигрышу Wmax.
Вывод: в процессе оптимизации управления методом ДП многошаговый процесс «проводится» дважды:
Первый раз - от конца к началу, в результате чего находятся условные оптимальные управления на каждом шаге и оптимальный выигрыш (тоже условный) на всех шагах, начиная с данного и до конца процесса;
второй раз - от начала к концу, в результате чего определяются (уже не условные) оптимальные шаговые управления на всех шагах процесса.
Общая постановка задачи ДП. Принципы решения.
После решения основных положений методом дадим общую постановку задачи ДП и сформулируем принципы их решения. При этом мы будем пользоваться обобщенными, символическими, а не расчетными формулами; каждая из которых выражает, что от чего зависит, но не дает возможности что-либо вычислить. Тем не менее, написание таких общих зависимостей очень полезно для усвоения сути метода.
Итак, пусть имеется некоторая физическая система S, которая с течением времени меняет ее состояние, т.е. В системе происходит какой-то процесс. Мы можем управлять таким процессом, т.е., тем или другим способом влиять на состояние системы. Такую систему S мы будем называть управляемой системой, а способ нашего воздействия на нее управлением U (это целая совокупность величин, векторов или функций).
Предположим, что с процессом связана какая-то наша заинтересованность, выражающаяся численной величиной W, которую будем называть «выигрышем». Мы хотим так управлять процессом, чтобы выигрыш был максимален.
Очевидно, выигрыш зависит от управления: W=W(U) (6)
Мы хотим найти такое управление (оптимальное) U=Uopt, при котором выигрыш
Wmax = MAX (W(U)) (7)
Таким образом, поставлена общая задача оптимизации управления физической системой. Однако должны быть еще учтены некоторые условия, накладываемые на начальное S0 и конечное Sw состояния системы. Они могут быть заданы конкретно или областью состояния: S0 S0, Sw Sw ( - знак включения).
Окончательно, общая задача оптимального управления формулируется следующим образом:
Из множества возможных управлений U найти такое оптимальное управление Uopt, которое переводит физическую систему S из начального состояния S0 S0, в конечное состояние Sw Sw так, чтобы при этом выигрыш W обращался в максимум.
Дадим процессу управления геометрическую интерпретацию. Для этого нам придется несколько расширить наши привычные геометрические представления и ввести понятие о так называемом фазовом пространстве (или пространстве состояний).
Состояние S системы, которой мы управляем, всегда можно описать с помощью того или другого количества численных параметров (в нашем примере, количество средств, вкладываемым в проект ПОД). Эти параметры будем называть фазовыми координатами системы S, а состояние системы изображать точкой S с этими координатами, размерность фазового пространства зависит от их числа. Если состояние системы характеризуется одним параметром ξ, то фазовое пространство будет одномерным и представляет собой участок оси абсцисс (рис. 1), а управление интерпретируется законом движения точки S из исходного состояния So S0 в конечное состояние Sw Sw. Если состояние системы характеризуется двумя параметрами ξ1, ξ2, то фазовое пространство будет двумерным, а процесс будет изображаться перемещением точки S0 по определенной траектории на фазовой плоскости ξ1, ξ2.
В основе упоминавшейся поэтапной процедуры решения задачи вначале находится условный оптимальный выигрыш Wi (S) на каждом i-м шаге и условное оптимальное управление Ui (S).
Рассмотрим i-й шаг процесса управления. Пусть в результате i-1 предыдущих шагов система пришла в состояние S, и мы выбираем какое-то управление U на i-м шаге. Если мы его применяем, то, во-первых, получим на этом шаге выигрыш Wi: он зависит как от состояния системы S, так и от примененного управления
Ui;Wi = Wi(S,Ui) (8)
Кроме того, получим какой то выигрыш, на всех оставшихся шагах. Соответственно принципу оптимальности, будем считать, что он максимален. Чтобы найти этот выигрыш, мы должны знать состояние системы перед следующим, (i=l)-м шагом. Под влиянием управления Ui на i-ом шаге система из состояния S и примененного управления Ui:
S` = φ1(S,Ui) (9)
Запишем выигрыш, который мы получим на всех шагах, начиная с i-го. Этот выигрыш будет равен выигрышу Wi на данном i-ом шаге, плюс условный оптимальный выигрыш на всех последующих, начиная с (i+l)-гo, определяемый для нового состояния системы S; обозначим его через W (S, Ui):
Wi(S,Ui)-Wi(S,Ui) + Wi+1(S,Ui) или с учетом (9)
Wi(S,Ui) =Wi(S,Ui) + Wi+1(φ1 (S,Ui)). (10)
Теперь, в соответствии с принципом оптимальности, мы должны выбрать такое управление Uopt=Ui, при котором величина (10) максимальны и достигает значения: Wi(S) =max {Wi(S,Ui) + Wi+1(φ1 (S,Ui))}. (11)
то управление Ui= Ui(S), при котором этот максимум достигается, и есть условное оптимальное управление на i-ом шаге, а сама величина (11) условный оптимальный выигрыш на всех шагах.
В уравнении (11) функции Wi(S, Ui) и (φi (S, Ui), известны, неизвестными остаются функции Wi(S) и Wi+1(S); из них первая выражается через вторую. Формула (11) представляет собой основное функциональное уравнение ДП; она позволяет определить функцию Wi(S), если известна следующая за ней по порядку функция Wi+1(S).
Условный оптимальный выигрыш па последнем шаге, определяется путем обращения в максимум выигрыша этого шага:
Wi(S) =max {Wm(S,Um))}. (12)
причем максимум берется не по всем возможным управлениям ит на m-м шаге, а только по тем, которые приводят систему в заданную область конечных состояний Sw. т.е. по тем, для которых
φm=(S, Um) S
Далее, одна за другой строится вся цепочка условных оптимальных управлений.
Вторая стадия оптимизации - нахождение безусловного (окончательного) оптимального управления
Uopt = (U10, U20, …, Um0).
Начнем с первого шага, предположим, что исходное состояние S0 нам полностью известно. Подставим это состояние S0 в формулу для условного оптимального выигрыша Wi(S). Получим : Wmax= Wi(S0) (13)
Оптимальное управление для первого шага найдется как: Uopt1=Ui(S0)
Далее, зная исходное состояние So и управление Uopt, можем найти состояние S*, системы после первого шага: S1*= φ1(S0, Uopt1) (14)
и конечное состояние системы S10=Sm, если оно заранее не было полностью определено. Uopt2 = (U2(S1), затем S2 =φ2 (S1, Uopt2) и т.д.,
Таким образом, идя по цепочке
S0→ Uopt1(S0)→S1”→ Uopt2 (S1”)→ Sm-1”→ Uopt m(Sm-1”)→ Sm”,
что и дает оптимальное управление процессом в целом: Uopt = (U10, U20, …, Um0).
Зная это состояние, можно найти оптимальное управление на втором шаге
Теперь можно установить следующий алгоритм решения задачи оптимизации методом ДП:
1. Выбрать способ описания процесса, т.е. параметры, характеризующие состояние системы, фазовое пространство и способ членения процесса на «шаги».
2. Записать выигрыш на i-ом шаге в зависимости от состояния системы S в начале этого шага и управления U1:
Wi = Wi(Ui)
Определить функцию, выражающую изменение состояния системы от S к S' под влиянием управления Ui(i-ro шага):
S’ = φi(S, Ui)
4. Сформулировать основное функциональное уравнение, выражающее функцию Wi(S) через Wi+1(S):
(максимум берется только по тем управлениям, которые приводят систему в заданную область конечных состояний Sm) и соответствующее ей условное оптимальное управление на последнем шаге Um.(S)
6. Зная Wm(S) и пользуясь результатом п.4, при конкретном виде функций Wi(S, Ui), φi(S, Ui), найти функции Wm-1(S), Wm-2(S),...,Wi(S) и соответствующие им условные оптимальные управления
7. Если начальное состояние S0 задано, найти оптимальный выигрыш Wmax= Wi(S0) и далее безусловные оптимальные управления (и, если надо, конечное состояние Sm*)по цепочке:
8. Если начальное состояние не задано, а лишь ограничено условием S0 S0, найти оптимальное начальное состояние S0*, при котором выигрыш W1(S) достигает максимума Wmax=max{W1(S)} и далее, по цепочке, безусловные оптимальные управления.
В принципе процесс ДП может разворачиваться и в направлении, обратном вышеописанному, но в смысле удобства изложения и понимания уступает принятому за основу.
