Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Чесноков, Н. И. Оптимизация решений при разработке урановых месторождений

.pdf
Скачиваний:
12
Добавлен:
21.10.2023
Размер:
9.51 Mб
Скачать

2-го сорта— ! г и 3-го сорта— ] т потери металла при указанных в условиях задачи случайных распределениях

будут минимальными и

составят 10 кг металла на

10 тыс. тисходной руды.

 

Для сравнения выполним расчет при условии, что

производительность схем

переработки равна среднему

количеству поставляемого металла в руде. Тогда в со­

ответствии с равенством (4.8)

 

 

 

П = ?і [РгР (а'і — 1, Pi)

■А'і Р (•+

ßi)] +

y2 [ßi^5 (xi ' ’ 11 ßa)

A'oP (x.,, ß2)[ -■)- y 3 [43P (л'з —

1, ß8)

xaP (л'з, ß3)]

= 15 [4P (4 — 1, 4) — 4P

(4, 4)] + 10 [2P (2 — 1, 2) —

— 2P(2, 2)] 4. 7 [1P (1 — 1,

1) — 1P (1,

1)] =

15 [4-(0,76 —

— 0,56)] + 10 [2 -0,85 — 2-0,6] + 7 [1-0,63

— 1-0,62] =

= 12 +

5 + 0,07= 17,07,

 

T. e. потери из-за неравномерности поставки в этом слу­

чае составят 17,1 кг па 1 г металла в поставляемой ис­ ходной руде.

Как видно из рассмотренного примера, планирование даже по очень надежным средним значениям не всегда приводит к оптимальному решению.

Например, если 1 кг металла стоит в конечном про­ дукте 20 руб., тогда игнорирование случайного характе­ ра поставки руды на обогатительную фабрику и при­ нятие при планировании средних значений приведет к

экономическому ущербу

на 10

тыс. т исходной

руды в

размере

 

 

 

 

/ = С(Яср- Я шт),

 

(4.12)

где 7— экономический

ущерб,

руб.;

С — цена 1

кг ме­

талла, руб.; /7,-р — потери металла

при планировании

производительности схем по средним значениям постав­

ки руды по сортам;

Я0пт — то же, при планировании с

учетом случайного характера поставки по сортам.

Подставляя

конкретные значения

в равенство

(4.12),

получим

7 = 20- (17,1 — 10,0) = 20-7,1 = 142 руб.

 

 

 

Если такой руды перерабатывается 5 млн. т/год, то

потерн металла составят

 

 

Ягод

10 000

( Я _

77 ) = ^ ° — ° ^

■7,1 = 3550

кг/год,

 

1

10 000

 

 

204

а экономический ущерб от потерь, когда нс учитывается случайный характер поставки руды по сортам, составит

/год = 3550 -20 — 71 100 руб/год.

Более детально вопросы одношагового стохастическо­ го программирования изложены в работах [26, 35, 55].

2. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ИГР

Очень часто из-за отсутствия достаточной инфор­ мации либо ее противоречивости человек попадает в си­ туацию, когда необходимо принять решение в условиях неопределенности. Такими ситуациями могут быть, на­ пример, выбор оптимальной производительности рудника при недостаточных сведениях о запасах (в сложных гео­ логических условиях), выбор наиболее эффективных и безопасных систем разработки в случае отсутствия до­ статочной информации о горнотехнических и горногеоло­ гических условиях месторождения и др.

Внешнее сходство принципов выбора линии поведе­ ния участниками салонных игр, спортивных встреч, а также при решении экономических пли технических за­ дач в условиях неопределенности послужило причиной

того, что такие ситуации были названы играми,

а мате­

матические методы их анализа — теорией игр

[24, 35,

36,

38].

 

 

Игры обычно ведутся по определенным правилам.

В результате игры каждый участник получает какой-то выигрыш (проигрыш в терминологии теории игр — это выигрыш, который выражается отрицательной величи­ ной). Игры различаются по числу участников. Нас будут интересовать в основном игры двух лиц (которые всегда могут быть представлены как игра человека с приро­ дой). Игра, в которой интересы игроков прямо противо­ положны, называется игрой с нулевой суммой, т. е. выигрыш одного из игроков равен проигрышу другого. Мы будем рассматривать игры в основном с пулевой суммой, хотя они далеко не исчерпывают класс уже изу­ ченных математиками ситуаций.

Многие игры связаны со случаем (сдача карт, напри­ мер). При формализации моделей таких игр, помимо личных ходов, вводят случайные ходы. Каждому слу­ чайному ходу приписывают распределение вероятностей возможных исходов. Одни из факторов, определяющих

205

поведение игроков, — информация, которой располагают стороны о собственном состоянии и состоянии против­ ника. Шахматы — это игра с полной информацией: доска находится перед противниками и внимательный игрок с хорошей памятью знает все о позиции, в которой прихо­ дится принимать решение. Домино — игра с неполной информацией: игроку неизвестен результат случайного хода — выбора фишек (камней) партнерами. То же можно сказать и о карточной игре (в данном случае исключается возможность шулерства).

Систему правил, однозначно определяющих выбор поведения игрока на каждом ходе в зависимости от си­ туации, сложившейся в процессе игры, называют стра­ тегией. Игрок, выбравший стратегию, может ие участво­ вать в игре: по составленной им инструкции игру может проводить нейтральное лицо. Особенно характерно это для шахмат. Каждая фиксированная стратегия, которую может выбрать игрок, называется его чистой стратегией. Чистые стратегии ие исчерпывают всех возможностей игроков. Существуют ситуации, в которых игрокам це­

лесообразно выбирать не чистую

стратегию, а частость

(вероятность), с которой следует

использовать

ту или

иную чистую стратегию в игре.

 

 

Пользуясь понятием «стратегия», можно любую игру

рассматривать следующим образом. Каждый

игрок

имеет один ход — выбор одной стратегии из некоторого множества возможных стратегии. При этом игрок при­ нимает решение, не имея никакой информации о выборе другого игрока. При двух участниках игра в стандарт­

ной форме называется

прямоугольной.

Прямоугольная

игра с конечным

числом чистых стратегий называется

матричной.

 

рассматриваются

только матрич­

В данном разделе

ные игры с нулевой суммой.

 

 

 

2-й игрок

 

 

 

Стратегии 2-го игрока

 

2

 

аи “іа аіз аи °15

\

*-

СВ /

h i а22 П-23 а2А «25

)

О

о.я X /

 

 

Ь я о

азі а32 азз а-м Ьъ

 

- и о,

 

« 2

Ь

а41 а42 С43 Ü44

I

5

 

\

h l аЬ2 К53 054 аЪъ

'

2 0 6

Пусть первый игрок имеет т стратегии, а второй — п:

 

2-й

игрок

 

 

 

 

0 ц а л . .

.

а ц . .

. а 1т

 

5^ /

^ 2 1 ^ 2 2 ■ •

^ '2 /

 

 

 

ац II = S

 

 

 

 

 

 

\

ап аіг

 

ац

-а/,

)

■ ■

 

■ui

. а п ,

При этом делается предположение:

если первый

игрок выберет /-ю стратегию,

а

второй — /-ю,

выигрыш

первого (проигрыш второго) равен аи. Матрица ||а,^|| называется платежной матрицей или матрицей выигры­ ша. Следует заметить, что составление платежной мат­ рицы при формализации реальных конфликтных ситуа­ ций— довольно сложная задача. Основания для построе­ ния платежной матрицы лежат, вообще говоря, вне области теории игр и относятся к конкретному приложе­ нию, с которым связана постановка задачи. Например, при разработке проекта иа строительство рудника, когда мет полной информации о запасах месторождения и не­ обходимо определить оптимальную его производитель­ ность, расчеты, как правило, проводят для нескольких

вариантов, каждый

из которых отличается величиной

запасов. Затем для

известных условий (т. е. для фикси­

рованных

запасов)

точно определяют стоимость строи­

тельства

рудника и

себестоимость добычи (не прибегая

к помощи теории игр). Однако выбор оптимальной про­ изводительности рудника без теории игр затруднен, так как не известны действительные запасы руды.

Пример выбора оптимальной производительности рудника с помощью теории игр рассмотрен ниже. Реше­ ние этого вопроса состоит в том, чтобы как можно меньше проиграть, в данном случае, в игре с природой Задача теории игр поэтому заключается в выработке принципов, определяющих поведение игроков в каждой конкретной конфликтной ситуации.

В некоторых играх каждый из игроков может вы­ брать чистую стратегию — линию поведения, обеспечи­ вающую ему некоторый гарантированный выигрыш (проигрыш) независимо от поведения противника.

Пусть стратегия первого игрока і0, а второго /0. При этом выигрыш первого игрока равен ш0/0, а выигрыш второго составляет —вцңо- Если первый игрок выберет

207

стратегию /о, а второй отступит от стратегии /0, выигрыш первого игрока может только увеличиться. Второй игрок,

выбирая стратегию /0.

не

дает

возможности первому

игроку выиграть больше

Таким образом,

___

 

 

 

(4.13)

где /= (], іи), /= ( 1, /г), т.

е. выбор стратегии /0 гаран­

тирует первому игроку

выигрыш

не меньше

сцо/0, а ис­

пользование стратегии

у0

вторым

игроком

гарантирует

ему, что первый игрок получит выигрыш не больше о,0/„ • Стратегии игроков і0 и /о называются оптимальными чистыми стратегиями. Пара чисел (/0; /о), отвечающая оптимальным стратегиям игроков, называется седловой точкой платежной матрицы, а число а,о;о— ценой игры. Матрица выигрышей может иметь несколько седловых

точек,

но все они всегда

определяют единственное

зна­

чение цепы игры.

 

 

 

 

Таким образом, игра имеет решение в чистых страте­

гиях,

если из платежной

матрицы можно выделить эле­

мент

аі0/0,

удовлетворяющий

соотношению

(4.13)

при

всех /

и /,

т. е. если платежная

матрица имеет седловую

точку.

В играх с седловой точкой каждый

из игроков

независимо от поведения противника может в каждой партии обеспечить так называемую ситуацию равнове­ сия, т. е. ситуацию, которую можно считать целью ра­ зумно действующих противников.

Доказано, что шахматы (а в принципе все игры с полной информацией) имеют решение в чистых страте­ гиях. Однако далеко не все игры обладают таким свой­ ством.

Во многих конфликтных ситуациях невозможно ука­ зать чистые стратегии, которые обеспечивали бы ситуа­ цию равновесия независимо от поведения игроков. Однако теория позволяет выбрать такую линию поведе­ ния, придерживаясь которой в каждой партии игрок мо­ жет обеспечить ситуацию равновесия в среднем (для многих партии) независимо от поведения противника. Если один из противников не будет в процессе последо­ вательного повторения партий придерживаться правил оптимального выбора стратегий, средний выигрыш дру­ гого может увеличиться. Но каждый из игроков всегда может придерживаться таких правил выбора стратегий, которые не позволят противнику превысить некоторый средний выигрыш в большом числе партий.

2 0 8

В играх с неполной информацией обычно теряет смысл разговор о какой бы то ми было фиксированной наиболее разумной линии поведения игроков в каждой партии. Как правило, в этих случаях невозможно обес­ печить ситуацию равновесия независимо от поведения противника и в том случае, если в последовательных партиях применять определенную последовательность чистых стратегий. Противник после некоторого числа партий изучит закономерности поведения партнера и воспользуется этим для выбора своей стратегии. Линия поведения будет максимально скрыта от противника в том случае, если для выбора стратегии в каждой пар­ тии используется некоторый случайный механизм. Во­ прос сводится к выбору статистических характеристик случайных механизмов, которые нужно применять для выбора стратегии в каждой партии. Другими словами, выбор оптимальной стратегии сводится к выбору часто­ сти (вероятности), с которой следует использовать каж­ дую чистую стратегию в игре.

Вектор U = (u\, ui, «з, • • Um), каждая компонента которого обозначает относительную частость (вероят­ ность), с которой соответствующая чистая стратегия используется в игре, называется смешанной стратегией

первого игрока. Вектор

W= (ші;

w2] w3; ...; wn) — сме­

шанная стратегия второго игрока. Разумеется, что

Ui >

0

 

при

і =

(1, m),

Wj

>

0

при

/ =

(1, п),

т

 

1,0;

п

 

J } ui =

/=і

 

£=і

 

 

 

 

Чистая стратегия может быть определена как сме­ шанная стратегия, в которой все составляющие, кроме одной, равны нулю. Поэтому удобно чистые стратегии обозначать в виде единичных векторов:

т

е, = (0, 0, . . . ГГ, 0, 0, ... , Ö),

І

п

е/ = (О? 0, 0, . . . ,1, 0, . . ., 0).

14 н. И. Чесноков и др.

209

Оптимальная стратегия игрока — это стратегия, обес­ печивающая ему максимально возможный средний вы­ игрыш, (При этом предполагается, что игра идет без обмана и подглядывании.)

Всякое изменение информации приводит к повоіі игре, для которой оптимальная линия поведения будет иной.

Если первый игрок с вероятностью іц выбирает і-ю чистую стратегию, а второй с вероятностью wj — свою чистую /-іо стратегию, то средний выигрыш первого иг­ рока будет равен

 

М (и,

т

п

aij ut Wj —■UА ■W

 

 

w) =

V

 

 

 

 

/=i

 

 

 

(здесь

A = Höijllm,7i — платежная

матрица).

Соответст­

венно

выигрыш

второго

игрока

равен —М.

Функция

M(U, W) называется платежной функцией. Естественное расширение понятия решения игры па

случаи смешанных стратегий приводит к следующему определению: игра имеет решение в смешанных страте­ гиях, если существуют такие стратегии U* и W* и чис­ ло V, что при любых смешанных стратегиях U и W вы­ полняются соотношения

Af(U, W *)< V <M (U *, W).

(4.14)

Полагая, что U = U* и W= W*, получим

 

V = M{V*, W*).

(4.15)

Здесь число V — цена игры.

Для доказательства существования решения доста­ точно проверить выполнение неравенства (4.14) для всех

чистых стратегий

et и е

 

На самом деле, если соотношение (4.14) выполняется

только для чистых стратегий, то для любых U и W

М (U*, W) =

V WjM (U*, е -) >

V V w} = V,

 

і= 1

/=і

и аналогично

 

 

 

M(U, W*) = V.

 

Понятие седловой точки, таким образом, распростра­ няется и на случай смешанных стратегий. Обычно гово­ рят, что игра имеет седловую точку (U*; W*), если пла-

210

| | a , - j | | .

тежиая функция A4(U; W) удовлетворяет неравенству (4.14) [35, 36]. Вообще говоря, выражения «игра имеет решение» и «игра имеет седловую точку» — синонимы.

В теории игр часто используют термины «максмин», означающий максимальный из всех минимально возмож­ ных выигрышей, или ннжиюю цепу игры (находится по строкам платежной матрицы), и «минимакс», соответ­ ствующий минимальному из всех максимально возмож­ ных выигрышей ßj (находят по столбцам платежной матрицы — табл. 50).

 

 

 

Т а б л и ц а 50

N.

В.

 

 

1

в ,

 

 

В,

“/

А\

А

а ц

а іг

. . .

G-ln

a 4

А ,

а 2і

flon

 

°2n

0 ,j

 

 

 

 

 

Ащ

аті

 

 

amn

aU

Р/

aji

aj1

 

an

 

Здесь Аі и ßj — стратегии игроков А и В.

 

Соотношение

между значениями

нижней

и верхней

цены игры может быть записано как

 

 

 

max min || acj j| <

min max || ajc || .

 

 

i

i

І i

 

 

Неравенство превращается в равенство в случае, если игра имеет седловую точку в чистых стратегиях.

В игре, где выбор каждого из игроков ограничен чи­ стыми стратегиями, гарантированный выигрыш первого игрока (который, естественно, не знает выбора против­ ника) равен max min Второй игрок, не зная вы­

14* 211

бора противника, может тем не менее не позволить ему выиграть больше min max ||«,;||.

Таким образом, в зависимости от выбранных обоими игроками чистых стратегий выигрыш первого игрока при указанных условиях заключен .между max min ||я,-,Ц

и min max ||au||.

Если же первый игрок получает информацию о вы­ боре противника, его гарантированный выигрыш стано­ вится равным min max ||агр-||. Это означает, что

а = min max || atj || — max min || ai;- || .

представляет приращение гарантированного выигрыша первого игрока за счет информации о выборе противни­ ка. Первому игроку целесообразно стремиться получить такую информацию только в том случае, если плата за нее не превышает величины о. В игре с седловой точкой в чистых стратегиях информация о выборе противника не меняет гарантированного выигрыша игрока.

В случае смешанных стратегий игры

min max М -.= min

 

т

п

 

шах V

V

аи щ Wj

 

 

і

i = i

/ =

і

 

max min М = max

 

т

и

 

min V

V dijiiiWj

 

 

w i

* ' =

i / = I

 

при Ui > 0 [i — (1, trij], Wj >

0 \j = (1, a)},

 

5 3 “i = i.

 

S ® / “ 1-

 

i=i••

 

/=i

 

 

 

Исходя из определения

max min A4 и

min max A4,

можно доказать неравенство

 

 

 

 

max min A4 < min max A4,

(4.16)

которое переходит в равенство в случае, если игра имеет седловую точку (W*, U*).

Максмин — это гарантированный средний выигрыш первого игрока, не знающего, какую смешанную стра­ тегию выбрал его противник. Минимакс-— это гаранти­ рованный средний выигрыш первого игрока, имеющего информацию о смешанной стратегии, выбранной вторым игроком.

212

Основная теорема теории игр утверждает, что любая матричная игра двух лиц с нулевой суммой всегда имеет решение, возможно, в смешанных стратегиях. Другими словами, всегда существуют такое число и такие векто­ ры U* и W:|:, что

M(V, W *)< l/ = M(U*f W *)= minmaxM(U, W) =

= max min M (U, W )<M (U*, W).

Процесс

вычисления оптимальных стратегий

U* и

W* и цены игры V называется процессом решения игры

млн просто

решением игры. Расчетным методом

для

определения оптимальной смешанной стратегии яв­ ляется линейное программирование, так как по существу отыскание оптимальной смешанной стратегии может быть представлено в виде одной из задач распределения.

Ниже приведены примеры применения теории игр для решения горно-экономических задач.

Пример 1. Необходимо определить оптимальную про­ изводительность рудника при запасах месторождения, оцениваемых 20—40 млн. т.

Предположим, что фактические запасы руды на ме­ сторождении при его отработке могут составить 20, 25, 30 или 40 млн. т. Возможные варианты количества за­ пасов руды будем называть стратегиями природы.

Для известных запасов руды может быть с помощью проектных расчетов выбрана наиболее оптимальная

производительность

рудника.

Пусть

такой

производи­

тельностью рудника для запасов

20 млн. т будет

1,0 млн. т/год, 25

млн. т — 1,2

млн.

т/год,

30 млн. г —

1,5 млн. т/год, 40

млн. т— 2,0 млн.

т/год. Возможные

варианты оптимальной производительности рудника бу­ дем называть стратегиями человека. Тогда платежная матрица будет иметь следующий вид:

2-й игрок (природа) Стратегии 2-го игрока

20 25 30 40

(4.17)

Здесь стратегия

природы — запасы руды, соответствен­

но равные 20, 25,

30 и 40 млн. т, стратегии человека —

2 1 3

Соседние файлы в папке книги из ГПНТБ