Основы проектирования энергосистем. В 2 ч. Ч. 1
.pdfс тем, по которому принималось решение. И все же такой подход лучше, чем принятие решения без всяких обоснований.
2.5. Одноцелевые статические задачи в условиях неопределенности
Данные задачи характеризуются следующими признаками: а) имеется одна цель (один критерий) оптимизации;
б) параметры и переменные (искомые) величины не изменяются во времени;
в) параметры, характеризующие исходную информацию, неопределенны, т.е. известно только, что эти параметры существуют, но их детерминированные и даже вероятностные характеристики неизвестны. При этом каждая возможная стратегия принятия решения связана с множеством возможных исходов. В этом сходство данной задачи с задачей принятия решений в условиях риска и отличие от детерминированных задач, заключающееся в том, что здесь отсутствует информация о вероятностных характеристиках исходов, которые известны в стохастических задачах.
Различают две группы неопределенностей – стратегические и природные.
Стратегические неопределенности появляются в ЗПР, в которых участвует несколько активно действующих сторон, преследую-щих различные, несовпадающие цели. При этом каждая из оперирующих сторон должна принимать решения в условиях, когда ей не-известны будущие действия (стратегии) других оперирующих сторон. Один из характерных примеров задачи со стратегической неопределенностью – игра в шахматы.
Природные неопределенности появляются из-за недостаточной изученности «природы», под которой понимают обстоятельства, в которых приходится принимать решения. Например, к задаче с природными неопределенностями можно отнести задачу выбора сечений проводов линий электропередачи в условиях неизвестности точ-ного значения ожидаемой нагрузки потребителей.
ЗПР со стратегическими неопределенностями решаются с использованием математического аппарата теории игр. Для ЗПР с природными неопределенностями применяют математический
31
аппарат тео-рии статистических решений (теории игр с «природой»).
Отличие ЗПР со стратегическими неопределенностями заключается в том, что каждой оперирующей стороне известен весь набор возможных стратегий другой стороны. При этом каждая оперирую-щая сторона, являясь активной и разумно действующей, стремится к максимально возможному достижению своих целей.
ЗПР с природными неопределенностями являются более сложными, т.к. «природа» не обладает свойством разумности и является пассивной стороной, не действующей активно. Ей нельзя придать никаких сознательных целей, к которым она бы стремилась.
Рассмотрим некоторые понятия теории игр, которые необходимы для решения ЗПР с природными неопределенностями
[14].
Пусть есть два игрока А и В, имеющие противоположные интересы. Чтобы игра могла быть математически формализована, должны быть сформулированы правила игры, определяющие:
возможные варианты действий каждой из сторон;
известность информации каждой стороне по принятии решений другой стороной;
результат игры, который получается при каждой данной совокупности принятия решений каждой из сторон.
Пусть игрок А имеет m стратегий, а игрок В – n стратегий. Такая игра называется игрой m
n. Если игроки осуществляют сознательный выбор одной из возможных стратегий, то выбор стратегии Аi и Вj однозначно определяет исход игры для игрока А – выигрыш (положительный или отрицательный). Обозначим этот выигрыш через аij.
Если известны значения аij при каждой паре стратегий, то можно составить табл. 2.2, называемую платежной матрицей.
Таблица 2.2
32
Платежная матрица
Bj |
|
B1 |
B2 |
… |
Bn |
|
i |
Ai |
|
|
|||||
|
|
|
|
|
|
|
|
A1 |
|
a11 |
a12 |
… |
a1n |
1 |
min a1 j |
|
|
|
|
|
|
|
j |
A2 |
|
a21 |
a22 |
… |
a2n |
2 |
min a2 j |
|
|
|
|
|
|
|
j |
|
|
|
|
|
|
|
|
Am |
|
am1 |
am2 |
… |
amn |
m |
min amj |
|
|
|
|
|
|
|
j |
j |
1 |
max ai1 |
2 max ai2 |
|
n max ain |
|
|
|
i |
i |
|
i |
|
|
|
|
|
|
|
|
Поставим задачу определить наилучшую среди стратегий для игрока А. Для этого рассмотрим последовательно каждую стратегию, начиная с А1 и кончая Аm. Выбирая стратегию Аi, будем иметь в виду, что игрок В ответит на нее такой стратегией, при которой выигрыш игрока А будет минимальным. Поэтому при каждой стратегии Аi игрок А сможет получить выигрыш, соответствующий лишь минимальному значению аij из строки платежной матрицы для стратегии Аi:
i |
min aij . |
|
j |
Эти значения приведены в крайнем правом столбце табл. 2.2. Выбирая из столбца i максимальное значение , получим гарантированный выигрыш для игрока А:
max |
i |
max min aij . |
(2.4) |
i |
|
i j |
|
Величина называется нижней ценой игры или максиминным выигрышем (максимином). Это – гарантированный выигрыш для игрока А.
Стратегия игрока А, соответствующая максимину , называется
максиминной стратегией.
33
Проведем аналогичные рассуждения за игрока В. Он будет принимать такую стратегию, которая превращала бы выигрыш игрока А в минимум. Если игрок В примет стратегию В1, то игрок А выберет из первого столбца (см. табл. 2.2) такую стратегию, которая дает ему максимальный выигрыш. Поэтому по каждому столбцу найдем максимальные значения (см. табл. 2.2, нижняя строка)
j |
max |
ij |
|
j |
|||
|
|
и выберем из них минимальное значение:
min |
j |
min max |
ij . |
(2.5) |
j |
|
j i |
|
|
При этом игрок В проиграет игроку минимальное значение. Величина
называется верхней ценой игры или минимаксным
выигрышем (минимаксом).
Стратегия игрока В, соответствующая выигрышу , называется минимаксной стратегией. Выбирая эту стратегию, игрок В будет иметь гарантию, что проиграет не более, чем .
Существуют игры, называемые играми с седловой точкой, в которой нижняя цена игры равна верхней:
== .
Втаких играх в платежной матрице содержится элемент, который является одновременно минимумом в своей строке и максимумом в своем столбце. Этот элемент называется с е д л о в о
йточкой. Седловая точка соответствует оптимальным стратегиям каждого из игроков.
Более подробно основы теории игр описаны в [14, 15].
Втехнических и экономических задачах часто возникает неопределенность из-за недостаточной осведомленности об условиях, в которых будет приниматься решение. Например, заранее может быть точно неизвестна погода, потребление электроэнергии, объем передачи энергии из соседних энергосистем, размеры перевозок топлива и т.п. В таких случаях в качестве противоборствующей
34
стороны выступает «при-рода», а такие ситуации называются «играми
сприродой».
Втеории статистических решений «природа» рассматривается как некая незаинтересованная сторона, поведение которой неизвестно и не содержит сознательного противодействия (как в теории игр) лицу, принимающему решение. В таких случаях также составляют
платежную матрицу со стратегиями игрока А1, А2, …, Аm и состояниями природы П1, П2, …, Пn (табл. 2.3).
Таблица 2.3
Платежная матрица
|
Пj |
П1 |
П2 |
… |
Пn |
Ai |
|
||||
|
|
|
|
|
|
A1 |
|
a11 |
a12 |
… |
a1n |
|
|
|
|
|
|
A2 |
|
a21 |
a22 |
… |
a2n |
|
|
|
|
|
|
… |
|
… |
… |
… |
… |
|
|
|
|
|
|
Am |
|
am1 |
am2 |
… |
amn |
|
|
|
|
|
|
В таких ситуациях в общем случае труднее принять решение, т.е. нет сознательного (разумного) противодействия со стороны «природы». Однако составление платежной матрицы все равно оказывается полезным, т.к. могут быть сделаны определенные выводы. На-иболее простой случай – когда какая-то из стратегий игрока А превосходит другие (табл. 2.4).
Таблица 2.4
Платежная матрица
|
Пj |
П1 |
П2 |
П3 |
Ai |
|
|||
|
|
|
|
|
A1 |
|
2 |
6 |
8 |
|
|
|
|
|
A2 |
|
14 |
8 |
12 |
|
|
|
|
|
A3 |
|
10 |
3 |
11 |
|
|
|
|
|
35
Из этой матрицы (см. табл. 2.4) видно, что стратегия А2 дает максимальный выигрыш при любом состоянии природы Пj. Поэтому игроку А следует однозначно выбрать стратегию А2.
Если же нет доминирующей стратегии, то все же полезно проанализировать платежную матрицу, чтобы исключить из нее заведомо невыгодные стратегии, если таковые имеются. Так, из платежной матрицы табл. 2.5 видно, что стратегия А1 заведомо невыгодна, т.к. при любом состоянии природы Пj у нее показатель эф-фективности хуже по сравнению с другими стратегиями.
Таблица 2.5
Платежная матрица
|
Пj |
П1 |
П2 |
П3 |
Ai |
|
|||
|
|
|
|
|
A1 |
|
2 |
3 |
8 |
|
|
|
|
|
A2 |
|
14 |
6 |
12 |
|
|
|
|
|
A3 |
|
10 |
8 |
11 |
|
|
|
|
|
На первый взгляд может показаться, что следует выбрать такую стратегию, при которой аij > аkl (см. табл. 2.3), например, выбрать
стратегию А2, т.к. а21 > а33 (см. табл. 2.5). Но здесь лучший показатель эффективности может оказаться не за счет лучшей
стратегии, а просто за счет того, что состояние природы П1 более выгодно, чем
состояние П3. Например, наличие большого расхода воды через ГЭС более выгодно для энергосистем, чем малая выработка электроэнергии на ГЭС в засушливый год.
В таких ситуациях бывает полезно использовать понятие риска, которое показывает «удачливость» принимаемой стратегии.
Риском rij игрока А в случае выбора стратегии Аi при состоянии природы Пj называется разность между выигрышем, который он получил бы, если бы знал, что состояние природы будет Пj, и выигрышем, который он получит, выбрав стратегию Аi [14].
36
Очевидно, что если заранее было бы известно состояние природы Пj, то игрок А выбрал бы такую стратегию, которая соответствует максимальному выигрышу, т.е. максимуму столбца
j:
j |
max aij . |
|
i |
Для состояния природы П1 |
|
1 |
max ai1 , |
|
i |
для других состояний природы |
|
2 |
max ai2 , |
|
i |
n |
max ain . |
|
i |
Тогда значения риска в случае выбора иной стратегии, не соответствующей максимуму столбца платежной матрицы:
rij |
j aij |
max aij aij . |
(2.6) |
|
|
i |
|
Отсюда следует, что rij
0. Расчеты на основании платежной матрицы (см. табл. 2.3) позволяют сформировать матрицу рисков
(табл. 2.6).
|
|
|
|
|
|
|
Таблица 2.6 |
|
|
|
|
Матрица рисков |
|
|
|
||
|
|
|
|
|
|
|
|
|
|
Пj |
П1 |
|
П2 |
|
… |
Пn |
|
Ai |
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
A1 |
|
r11 |
|
r12 |
|
… |
r1n |
|
A2 |
|
r21 |
|
r22 |
|
… |
r2n |
|
|
|
|
|
|
|
|
37 |
|
… |
… |
… |
… |
… |
Am |
rm1 |
rm2 |
… |
rmn |
Матрица рисков часто позволяет лучше осуществить анализ неопределенной ситуации, чем платежная матрица. Рассмотрим это на примере. Пусть известна платежная матрица, приведенная в табл. 2.7. Используя формулу (2.6), сформируем матрицу рисков (табл.
2.8).
Таблица 2.7
Платежная матрица
Пj |
П1 |
П2 |
П3 |
П4 |
|
Ai |
|||||
|
|
|
|
||
A1 |
5 |
8 |
9 |
13 |
|
|
|
|
|
|
|
A2 |
8 |
13 |
9 |
8 |
|
|
|
|
|
|
|
A3 |
9 |
11 |
11 |
7 |
|
|
|
|
|
|
Таблица 2.8
Матрица рисков
Пj |
П1 |
П2 |
П3 |
П4 |
|
Ai |
|||||
|
|
|
|
||
A1 |
4 |
5 |
2 |
0 |
|
|
|
|
|
|
|
A2 |
1 |
0 |
2 |
5 |
|
|
|
|
|
|
|
A3 |
0 |
2 |
0 |
6 |
|
|
|
|
|
|
Из табл. 2.7 следует, что а21 = а24, но из матрицы рисков (табл. 2.8) r21 < r24. При стратегии А2 при состоянии природы П1 выигрыш мог бы составить а21 = 8 (см. табл. 2.7) при максимальном возможном выигрыше а31 = 9, т.е. выбор стратегии А2 хороший.
Но в то же время при состоянии природы П4 выбор стратегии А2 не следовало бы делать, т.к. там максимальный выигрыш а14 = 13, а а24 равно лишь 8, т.е. выбор стратегии А2 плохой. Это отражается в
матрице рисков (см. табл. 2.8): а24 > а21, а именно, 5 > 1. Рассмотрим теперь критерии, которые используются для
принятия решений в условиях неопределенности.
1. Критерий, основанный на известных вероятностях условий (критерий Лапласа).
Пусть известны состояния природы П1, П2, …, Пn и известны вероятности их появления
р1 = Р(П1), р2 = Р(П2), …, рn = Р(Пn),
причем
38
n
p j 1.
j1
Вэтом случае в качестве показателя эффективности принимают математическое ожидание выигрыша. Используя платежную матрицу (см. табл. 2.3), для i-й стратегии математическое ожидание выигрыша можно записать в виде
|
|
|
|
|
|
|
|
ai p1ai1 |
p2ai2 ... |
pnain |
|||
или |
|
|
||||
|
|
|
|
|
n |
|
|
|
ai |
p j aij. |
(2.7) |
||
|
|
|
|
|
j 1 |
|
Тогда в качестве оптимальной следует взять ту стратегию, для которой значение аi максимально:
|
|
|
|
|
ai макс max{ai}. |
(2.8) |
|||
Для выбора оптимальной стратегии можно использовать матрицу рисков (см. табл. 2.6). При этом для каждой стратегии следует вычислить математическое ожидание риска:
|
|
n |
|
ri |
p j rij. |
(2.9) |
|
|
j |
1 |
|
Тогда в качестве оптимальной следует взять ту стратегию, для
которой значение ri минимально:
|
|
|
|
|
ri мин min{ri}. |
(2.10) |
|||
Если вероятности появления состояний природы Пj неизвестны, то применяют следующие приемы:
39
а) задаются вероятностями р1, р2, …, рn субъективно или на основе экспертных оценок;
б) если нет никаких соображений относительно предпочтений того или иного состояния природы, то используют принцип недостаточного основания Лапласа, согласно которому все вероятности назначаются одинаковыми:
р1 = р2 =…= рn = 1n .
2. Максиминный критерий Вальда.
Для его вычисления используют платежную матрицу (см. табл. 2.2 и 2.3) и принцип определения максимина по формуле (2.4). Оптимальной считается та стратегия игрока А, при которой гарантируется выигрыш не меньший, чем максимин:
W max min aij , |
(2.11) |
1 i m 1 j n |
|
где аij – показатель эффективности, взятый из платежной матрицы;
i– количество стратегий;
j– количество состояний природы.
Этот критерий ориентирует лицо, принимающее решение, на наихудшие условия. Его иногда называют критерием крайнего пессимизма.
3. Критерий минимаксного риска Сэвиджа..
По данному критерию рекомендуется выбирать ту стратегию, при которой величина риска принимает наименьшее значение в самой неблагоприятной ситуации. Для его вычисления используют матрицу рисков (см. табл. 2.6) и формулу минимакса (2.5). Оптимальной считается та стратегия игрока А, при которой гарантируется риск не более, чем минимакс:
S min max rij , |
(2.12) |
1 i m 1 j n |
|
где rij – показатель риска из матрицы риска при i-й стратегии и j-м состоянии природы.
40
