Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Математика Сизов 2011

.pdf
Скачиваний:
210
Добавлен:
15.02.2015
Размер:
4.26 Mб
Скачать

стратегий x и y , называются оптимальными смешанными стратегиями, а число E x*, y* называется ценой (значением) игры для

игрока I. Совокупность оптимальных стратегий x*, y* называется оптимальным решением или просто решением игры. Для оптимальных смешанных стратегий x*, y* имеет место равенство

v1 v2 .

Теорема о минимаксе (фундаментальная теорема Неймана): каждая конечная матричная игра с нулевой суммой имеет, по

крайней мере, одно решение, возможно в области смешанных стратегий, причем цена игры v удовлетворяет условию

v .

Мы не будем останавливаться на строгом доказательстве этой теоремы.

Элементы теории статистических решений.

В рассмотренных выше матричных играх предполагалось, что в них принимают участие два игрока, интересы которых противоположны. Поэтому действия каждого игрока направлены на увеличение выигрыша (уменьшение проигрыша). Однако, в некоторых задачах, приводимым к игровым, имеется неопределенность, вызванная отсутствием об условиях, в которых осуществляется действие (погода, покупательский спрос и т.д.) Эти условия зависят не только от сознательных действий другого игрока, но и от объективной действительности. Такие игры называются играми с природой. Человек в играх с природой старается действовать осмотрительно, второй игрок (природа, покупательский спрос) действует случайно.

Принятие решений в условиях неопределенности и риска являются разделом, наиболее тесно связанным с исследованием операций, как по своему духу, так и по постановкам вопросов.

Основной задачей теории статистических решений является основной выбор решений в условиях неопределенности, когда каждое действие приводит к одному из множества частных исходов, вероятности которых неизвестны или даже не имеют смысла. В условиях неопределенности человек или автомат, выбирающий то или иное решение, не располагает полной информацией о всех факторах, учет которых оказывает случайное влияние на этот выбор. В некоторых задачах состояние природы может быть задано распределением вероятностей. В этом случае принято говорить о выборе решений в условиях риска. Здесь каждый шаг решения приводит к одному из множества возможных частных исходов, каждый из которых имеет известную вероятность появления.

389

Теория статистических решений (игр с природой) тесно связана с теорией стратегических игр. Имеется ряд критериев, которые используются при выборе оптимальной стратегии. Рассмотрим некоторые из них.

1. Критерий Вальде. Рекомендуется применять максимальную стратегию. Она достигается из условия

maxi minj aij

и совпадает с нижней ценой игры (т.е. гарантирует выигрыш, не менее, указанного числа). Критерий является пессимистическим, считается, что природа будет действовать наихудшим для человека образом.

2.Критерий максимума. Он выбирается из условия

maxi maxj aij

Критерий является оптимистическим, считается, что природа будет благосклонна к человеку.

3. Критерий Гурвица. Критерий рекомендует стратегию, определяемую по формуле

max{ min aij 1 max aij },

где – степень оптимизма – изменяется в диапазоне 0.1 .

Критерий придерживается некоторой промежуточной позиции, учитывающей возможность как наихудшего, так и наилучшего для человека поведения природы. При 1критерий превращается в критерий Вальде, при 0 – в критерий максимума. На оказывает влияние степень ответственности лица, принимающего решение по выбору стратегии. Чем хуже последствия ошибочных решений, больше желания застраховаться, тем ближе к единице.

4. Критерий Сэвиджа. Суть критерия состоит в выборе такой стратегии, что бы не допустить чрезмерно высоких потерь, к которым она может привести. Находится матрица рисков, элементы которой показывают какой убыток понесет человек (фирма), если для каждого состояния природы он не выберет наилучшей стратегии.

Элемент матрицы рисков rij находится по формуле

rij max aij aij

где max aij — максимальный элемент в столбце исходной матрицы.

Оптимальная стратегия находится из выражения min max max aij aij .

390

23.2. Решение типовых задач

 

 

 

0,1

0,9

 

 

Пример 1. Задана матрица

P1

 

 

 

 

.перехода системы из

 

0,8

0,2

 

 

 

 

 

 

состояния i(i 1,2) в состояние j( j 1,2)

за один шаг. Найти матрицу

P3 перехода системы из состояния i в состояние j за два шага.

 

 

 

 

 

Решение. Чтобы найти матрицу P2

перехода системы за два

 

шага нужно матрицу P1

умножить саму на себя.

 

 

 

 

 

 

 

 

 

 

 

 

 

0,1

0,9 0,1

0,9

0,73 0,27

 

 

 

 

 

 

 

 

 

 

 

P2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

Задача

 

2.

0,8

0,2 0,8

0,2

0,24 0,76

 

 

 

 

 

 

 

 

Определить

нижнюю

и

верхнюю

цены

для

игр,

 

 

 

 

 

 

 

 

 

 

 

 

 

6

4

5

3

 

 

заданных

 

 

матрицами

платежей

 

 

4

5

7

8

 

и

 

 

 

A1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

5

2

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

4

1

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A2

4

5

3

4

.

 

 

 

 

 

 

 

 

 

 

 

 

0

5

2

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решение. Для матриц A1

и A2

соответственно имеем :

 

 

 

 

 

 

 

1

max{3;4;2} 4 ,

 

1

min{8;5;7;8} 5 ,

 

 

 

 

 

 

2 max{1;3;0} 3,

 

2

min{4;5;3;6} 3.

 

 

 

 

 

Задача 3. Найти оптимальные стратегии и цену игры

 

 

 

 

2

5

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A

1

9

5

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решение. Найдем наилучшую стратегию игры первого игрока

при первой стратегии

a1 min a1ij

min( 2 ,5,2 ) 2

и при второй

 

 

 

 

 

 

 

 

 

j

 

 

 

 

 

 

 

 

 

стратегии

a2 min a2 j min(1,9,5) 1, тогда

max ai

max(2,1) 2 –

 

 

 

 

 

 

j

 

 

 

 

 

i

 

 

 

 

 

 

гарантированный выигрыш, который может обеспечить себе первый игрок.(нижняя цена игры (максимин)).

Аналогично находим наилучшую стратегию второго игрока (по

столбцам) для первой стратегии

b1

max aij max(2,1) 2

, для второй

 

 

i

 

b2

max aij max(5,9) 9

, для третьей –

b3

max aij max(2,5) 5

,

 

 

i

 

 

i

 

тогда, если второй игрок будет придерживаться своей минимаксной стратегии, то он гарантирован, что в любом случае проиграет не

больше min bj min(2,9,5) 2 .

j

Оптимальная стратегия первого игрока будет первая, второго первая. Так как 2 , то это число и есть цена игры. Таким

образом данная задача – игра с седловой точкой.

391

Рассмотрим задачу без седловой точки.

Задача 4. Найти оптимальные стратегии и цену игры

 

2

1

 

 

 

 

 

A

0

5

.

 

 

Решение. Вычислим нижнюю и верхнюю цены игры, заданной матрицей А: max{1;0} 1, min{2;5} 2 , т.е. матрица А не имеет

седлового элемента. Обозначим через

 

 

x1, x2

и

 

y1, y2

 

x

y

соответственно смешанные стратегии

игроков I

и

II. Тогда

оптимальные смешанные стратегии игроков I и II и цена игры v определяются следующими двумя системами уравнений:

2x

 

 

 

 

 

v

 

 

 

2 y

 

y

 

v

 

1

5x2

 

v

 

 

 

 

 

1

 

 

2

v

 

x1

 

 

 

 

 

 

 

 

5y2

 

x

 

x

2

 

1

 

 

 

 

y

 

y

2

1

 

1

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

Следовательно, оптимальные смешанные стратегии и цена игры

 

 

 

 

 

 

 

5

 

1

 

 

 

 

2

 

1

 

 

5

 

соответственно равны:

x

;

,

 

;

, v

.

 

6

6

 

y

3

3

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача 5. Железная дорога разработала несколько планов летних расписаний по перевозке на пригородных электричках с учетом конъюнктивы перевозок и спроса пассажиров. Получающиеся от их возможных сочетаний показатели прибыли представлены в таблице. Определить: а) оптимальный план летнего расписания и цену игры; б) какой стратегии следует придерживаться ЖД, если наиболее

вероятной является ситуация: C1

– с1%, C2 – с2%, C3

– с3%.

 

с1=30%; с2=50%;с3=20%;

 

 

 

План

Величина прибыли в зависимости от спроса,

 

расписаний

 

 

млн.руб.

 

 

 

 

С1

 

С2

 

С3

 

П1

1

 

1

 

3

 

П2

2

 

2

 

1

 

П3

1

 

3

 

1

 

 

1

1

3

Решение. а) Составим матрицу игры

 

2

2

1

 

A

.

 

 

1

3

1

 

 

 

 

Вычислим нижнюю и верхнюю цены игры, заданной матрицей А:

max{1;1;1} 1, min{2;3;3} 2 , т.е. матрица А не имеет седлового

элемента. Обозначим через x x1, x2 , x3 и y y1, y2 , y3 соответственно смешанные стратегии игроков I и II. Тогда оптимальные смешанные стратегии игроков I и II и цена игры v определяются следующими двумя системами уравнений:

392

 

x

 

x

2

 

3x

v

 

1

 

 

 

3

 

2x1

 

2x2

 

x3

v

 

x

 

3x

2

 

x

v

 

1

 

 

 

3

 

 

x

 

x

2

 

x

1

 

1

 

 

 

3

 

 

 

y

 

 

 

 

 

2 y

2

 

 

 

 

y

3

 

v

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y1

 

 

 

 

 

2 y2

 

 

 

3y3

 

v

 

 

 

 

 

 

 

 

 

 

y2

 

 

 

 

y3

 

v

 

 

 

3y1

 

 

 

 

 

 

 

 

 

 

 

 

y

 

 

 

 

 

y

2

 

 

 

 

y

3

 

1

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Следовательно, оптимальные смешанные стратегии и цена игры

 

 

 

 

1

;

1

;

1

 

 

 

 

1

;

2

;0

 

v

5

.

 

 

 

 

 

соответственно равны: x

3

3

3

,

 

y

3

3

,

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

б) Определим три стратегии с учетом заданных вероятностей

ситуаций:

для плана П1:

0,3 1 0,5 1 0,2 3 1,4,

для плана П2: 0,3 2 0,5 2 0,2 1 1,8 ,

 

для плана П3:

0,3 1 0,5 3 0,2 1 2 .

 

Согласно формулы оптимальной стратегии max{1,4;1,8;2} 2

железной дороге выгоднее составить расписание П3.

Задача 6. По данным наблюдений за несколько предыдущих лет, магазин по продажи одежды может реализовать в условиях теплой погоды 700 блузок и 300 свитеров, а при прохладной погоде – 400 блузок и 500 свитеров. Затраты магазина в течении июля-августа на единицу продукции составили: блузки – 70 ден. ед., свитера – 85 ден. ед. Цена реализации составляет 115 и 95 ден. ед. соответственно. В связи с возможными изменениями погоды определить стратегию магазина при закупки товара, обеспечивающую ему максимальный доход от реализации продукции. Задачу решить с использованием критериев «природы», приняв степень оптимизма равным 0,5.

Решение. Магазин располагает двумя стратегиями: А1 – в этом сезоне будет теплая погода, А2 – погода будет прохладная.

Если магазин примет стратегию А1 и в действительности будет теплая погода (стратегия природы В1), то закупленная продукция (700 блузок и 300 свитеров) будет полностью реализована и доход составит

700 115 70 300 (95 85) 34500 ден. ед.

В условиях, если погода будет прохладной (стратегия природы В2), то закупленные свитера будут проданы полностью, а блузки только в количестве 400 и часть останется нереализованной. Доход составит

400 115 70 300 (95 85) 115 70 700 400 13500 ден.

ед.

393

Рассуждая аналогичным образом, если магазин примет стратегию А2 и в действительности погода будет прохладной, то доход составит

400 115 70 500 (95 85) 23000 ден. ед.

Если погода будет теплая, то доход составит

400 115 70 300 (95 85) 95 85 500 300 19000ден.

ед.

Рассматривая магазин и погоду в качестве двух игроков, получим платежную матрицу

A

 

B1

B2

 

 

 

34500

13500

 

,

1

 

23000

19000

 

A

 

 

 

2

 

 

 

 

 

max 13500,19000 ден. ед.

min 34500,19000 ден. ед.1900019000

Цена игры равна 19000 ден. ед.

Оптимальный план закупки товара составит 400 блузок и 500 свитеров, тогда при любой погоде доход составит 19000 ден. ед.

В условиях неопределенности, если не предоставляется возможности магазину использовать смешанную стратегию (договоры с другими организациями), для определения оптимальной стратегии магазина используем критерии природы.

1. Критерий Вальде:

max min aij max 13500,19000 19000 ден. ед.

магазину целесообразно использовать стратегию А2. 2. Критерий максимума:

max max aij max 34500,23000 34500 ден. ед.

целесообразно использовать стратегию А1.

3. Критерий Гурвица: для определения примем степень оптимизма равным 0,5, тогда для стратегии магазина

min aij 1 max aij 0,5 13500 0,5 34500 24000 ден. ед.;

для стратегии А2

min aij 1 max aij 0,5 19000 0,5 23000 21000 ден. ед.,

магазину целесообразно использовать стратегию А1.

4. Критерий Сэвиджа. Максимальный элемент в первом столбце –34500, во втором столбце – 19000.

Элементы матрицы рисков находятся из выражения

rij max aij aij ,

откуда r11 34500 34500 0 , r12 19000 13500 5500 ,

r21 34500 23000 11500 , r22 19000 19000 0.

Матрица рисков имеет вид

394

0

5500

 

 

 

 

 

0

 

11500

 

min max max aij aij min 11500,5500 5500 ден. ед.,

целесообразно использовать стратегию А1.

Следовательно, магазину целесообразно применять стратегию

А1.

23.3. Задание на контрольную работу

 

Задача 1. Задана матрица P1 перехода системы из состояния

i(i 1,2) в состояние

j( j 1,2) за один шаг. Найти матрицу P3 перехода

системы из состояния i в состояние j за три шага.

 

 

 

 

 

 

 

0,2

0,8

 

 

 

 

 

 

 

1.

P1

 

 

 

 

 

 

 

0,2

0,8

 

 

0,4

0,6

.

 

 

 

 

 

 

6.

P1

 

 

 

 

 

 

 

0,4

0,6

 

 

0,6

0,4

.

 

 

 

 

 

 

2.

P1

 

 

 

 

 

 

 

0,5

0,5

 

 

0,9

0,1

.

 

 

 

 

 

 

7.

P1

 

 

 

 

 

 

 

0,1

0,9

 

 

0,3

0,7

.

 

 

 

 

 

 

3.

P1

 

 

 

 

 

 

 

0,4

0,6

 

 

0,2

0,8

.

 

 

 

 

 

 

8.

P1

 

 

 

 

 

 

 

0,3

0,7

 

 

0,3

0,7

.

 

 

 

 

 

 

4.

P1

 

 

 

 

 

 

 

0,1

0,9

 

 

0,5

0,5

.

 

 

 

 

 

 

9.

P1

 

 

 

 

 

 

 

0,4

0,6

 

 

0,2

0,8

.

 

 

 

 

 

 

5.

P1

 

 

 

 

 

 

 

0,7

0,3

 

 

0,6

0,4

 

 

 

 

 

 

 

10. P1

 

 

 

 

 

 

 

 

 

 

 

0,6

0,4

 

 

 

 

 

 

 

 

 

 

 

395

Задача 2. Найти оптимальные стратегии и цену игры

 

 

2

3

2

 

 

 

2

5

 

2

 

1.

 

1 9

4

 

6.

 

2 9

 

7

 

A

.

A

 

.

 

 

2

3

3

 

 

 

4

5

 

2

 

 

 

 

 

 

 

 

 

3

5

2

 

 

2

 

5

2

 

 

2.

 

1 8

5

 

7.

 

3 1

5

 

 

A

.

A

.

 

 

1

2

4

 

 

 

4

 

3

2

 

 

 

 

 

 

 

 

 

 

 

1

6

3

 

3

5

 

8

3.

 

5 9

7

 

8.

 

1 9

 

5

 

A

.

A

 

.

 

 

1

1

2

 

 

 

2

6

 

6

 

 

 

 

 

 

 

 

 

 

2

5

2

 

 

 

4

5

 

2

 

 

 

1 9

5

 

 

 

1 9

 

9

 

4. A

.

9. A

 

.

 

 

2

1

3

 

 

 

3

6

 

3

 

 

 

 

 

 

 

 

 

3

8

2

 

 

 

 

3

5

 

2

5.

 

1

9

6

 

10. A

 

 

1

9

 

6

 

A

.

 

 

 

.

 

 

2

1

3

 

 

 

 

 

2

7

 

3

 

 

 

 

 

 

 

 

 

 

Задача 3. Железная дорога разработала несколько планов летних расписаний по перевозке на пригородных электричках с учетом конъюнктивы перевозок и спроса пассажиров. Получающиеся от их возможных сочетаний показатели прибыли представлены в таблице. Определить: а) оптимальный план летнего расписания и цену игры; б) какой стратегии следует придерживаться ЖД, если наиболее вероятной является ситуация: C1 – с1%, C2 – с2%, C3 – с3%.

1.

с1=20%; с2=40%;с3=40%;

 

 

План

 

 

Величина прибыли в зависимости от спроса, млн.руб.

расписаний

 

С1

 

 

С2

С3

П1

 

2

 

 

1

2

П2

 

3

 

 

1

1

П3

 

1

 

 

3

1

2.

с1=30%; с2=40%;с3=30%;

 

 

 

 

 

 

 

 

План

 

 

Величина прибыли в зависимости от спроса, млн.руб.

расписаний

 

С1

 

С2

С3

П1

 

 

3

 

 

1

2

П2

 

 

3

 

 

2

1

П3

 

 

2

 

 

3

1

396

3.с1=10%; с2=50%;с3=40%;

План

 

Величина прибыли в зависимости от спроса, млн.руб.

расписаний

 

 

 

 

 

 

 

 

С1

 

С2

С3

П1

 

4

 

 

1

 

2

П2

 

3

 

 

2

 

1

П3

 

1

 

 

3

 

3

4.

с1=30%; с2=30%;с3=40%;

 

 

 

 

 

 

 

 

План

 

Величина прибыли в зависимости от спроса,

расписаний

 

 

 

 

млн.руб.

 

 

 

 

С1

 

С2

 

С3

П1

 

 

3

 

 

1

 

2

П2

 

 

4

 

 

3

 

1

П3

 

 

2

 

 

3

 

2

5.

с1=40%; с2=40%;с3=20%;

 

 

 

 

 

 

План

 

Величина прибыли в зависимости от спроса,

расписаний

 

 

 

 

млн.руб.

 

 

 

 

С1

 

С2

 

С3

П1

 

 

3

 

 

2

 

3

П2

 

 

3

 

 

1

 

1

П3

 

 

1

 

 

3

 

1

6.

с1=40%; с2=30%;с3=30%;

 

 

 

 

 

 

План

 

Величина прибыли в зависимости от спроса,

расписаний

 

 

 

 

млн.руб.

 

 

 

 

С1

 

С2

 

С3

П1

 

 

3

 

 

1

 

2

П2

 

 

3

 

 

2

 

1

П3

 

 

2

 

 

3

 

3

7.с1=10%; с2=40%;с3=50%;

План

Величина прибыли в зависимости от спроса,

расписаний

 

 

млн.руб.

 

 

С1

 

С2

С3

П1

4

 

1

2

П2

2

 

2

1

П3

1

 

3

3

 

 

397

 

 

8.с1=35%; с2=30%;с3=35%;

План

Величина прибыли в зависимости от спроса,

расписаний

 

млн.руб.

С3

 

С1

С2

П1

3

1

2

П2

4

3

1

П3

3

2

2

9.с1=25%; с2=35%;с3=40%;

План

 

Величина прибыли в зависимости от спроса,

расписаний

 

 

млн.руб.

 

 

 

С1

 

С2

С3

П1

 

2

 

1

3

П2

 

3

 

1

1

П3

 

2

 

3

1

10.

с1=30%; с2=35%;с3=35%;

 

 

 

 

 

План

 

Величина прибыли в зависимости от спроса,

расписаний

 

 

млн.руб.

 

 

 

С1

 

С2

С3

П1

 

3

 

3

2

П2

 

3

 

2

1

П3

 

2

 

3

1

Задача 4.

1.Фирма производит пользующиеся спросом брюки и юбки,

реализация которых зависит от сезона года. Затраты фирмы в течении июля-августа на единицу продукции составили: брюки — 19 ден.ед.,

юбки — 8 ден.ед. Цена реализации составляет 40 и 20 ден.ед. соответственно. По данным наблюдений за несколько предыдущих

лет, фирма может реализовать в условиях теплой погоды 700 брюк и 2021 юбок, а при прохладной погоде — 1100 брюк и 780 юбок. В связи с возможными изменениями погоды определить стратегию

фирмы в выпуске продукции, обеспечивающую ей максимальный

доход от реализации продукции. Задачу решить с использованием

критериев «природы», приняв степень оптимизма равным 0,5.

2.По данным наблюдений за несколько предыдущих лет,

фабрика, производящая обувь, может реализовать в условиях теплой

погоды 1017 туфель и 3096 босоножек, а при прохладной погоде – 1275 туфель и 803 босоножек. Затраты фабрики в течении июляавгуста на единицу продукции составили: туфли – 73 ден.ед., босоножки – 52 ден.ед. Цена реализации составляет 120 и 82 ден.ед. соответственно. В связи с возможными изменениями погоды

398