
- •Лекции по дисциплине
- •Основные этапы операционного исследования
- •Глава 1. Задачи линейного программирования
- •Возможные случаи допустимого множества решений задачи линейного программирования
- •Возможные случаи оптимальных решений (планов) задачи линейного программирования.
- •Графоаналитический способ решения задач линейного программирования
- •Симплекс-метод
- •Алгоритм симплекс-метода
- •1.5. Метод искусственного базиса (м-метод)
- •Алгоритм м-метода:
- •1.6. Элементы теории двойственности
- •Основная теорема двойственности
- •Вторая теорема двойственности
- •Глава 2. Элементы матричных игр
- •2.1. Формальное представление игр. Понятие матричной игры
- •2.2. Принцип миинимакса решения матричных игр.
- •2.3. Смешанные стратегии. Основные свойства решений в смешанных стратегиях.
- •2.4. Методы решения матричных игр.
- •Упрощение игр с помощью отбрасывания доминируемых стратегий.
- •3. Графический метод решения игр 2хn и mх2.
- •Метод сведения матричной игры к задаче линейного программирования.
- •4.5. Итерационный метод Брауна – Робинсон.
- •2.5. Игры с природой.
- •Список рекомендуемой литературы.
2.5. Игры с природой.
До сих пор рассматривались модели таких конфликтных ситуаций, в которых противники были равноправны и, стремясь к противоположным целям, одинаково придерживались осторожного принципа минимакса. Однако в реальной действительности довольно часто возникают качественно иные ситуации конфликта двух сторон. Они по-прежнему формально описываются матрицей выигрыша Н=||аij||i=1,…,m,j=1,…,n одного из игроков (А), который, как обычно, выбирает свои стратегии сознательно, стремясь к увеличению своего выигрыша. Но второй игрок (В) особенный. О нем известно, что:
- либо он придерживается фиксированной смешанной стратегии SB=(q1,…,qn) (случай стохастической определенности),
- либо о том, чем именно руководствуется игрок В, вообще ничего не известно (случай неопределенности).
Такие ситуации называются «играми с природой», игрок В («природа») чаще всего представляет собой не конкретное лицо, а объективную реальность. Его стратегиями Вj служат состояния «природы» (тип погодных условий, спрос на определенную продукцию и. т. п. ). Целью исследования такой игры является поиск разумных правил выбора игроком А каких-либо из своих возможных стратегий.
Рассмотрим некоторые способы такого выбора в зависимости от специфики той или иной ситуации.
Случай 1. Пусть смешанная стратегия SB=(q1,…,qn) «природы» известна, т. е. известны вероятности их состояний В1,…,Вn (например, на основании статистических данных).
Вычислим средние выигрыши (математические ожидания) игрока А при применении им каждой из его чистых стратегий:
при А1 имеем Н(A1,SB) = a11q1+…+a1nqn = v1,
……………………………………………
при Аm имеем Н(Аm,SB) = am1q1+…+amnqn = vm.
Остается сравнить полученные значения и выбрать среди них наибольшее v*=max(v1,…,vm). Чистая стратегия Аi*, соответствующая этому значению, является оптимальной для игрока А. При этом нетрудно показать, что применение каких-либо смешанных стратегий игроку А не выгодно, так как это может привести только к уменьшению среднего выигрыша v*.
Случай 2. Пусть стратегии «природы» неизвестны, но они по-прежнему могут быть смешанными, т. е. количество партий с природой неограниченно. Рассмотрим два возможных подхода к решению этой задачи.
а) Принцип недостаточного основания Лапласа. Если нет никаких оснований считать, что какая-либо стратегия «природы» имеет большую частоту, чем любая другая стратегия, то мы можем предположить, что вероятности всех стратегий В1,…,Вn одинаковы: q1=…=qn=1/n. Тогда гипотетические средние выигрыши игрока А при использовании его чистых стратегий А1,…, Аm определяются соответственно равенствами:
v1L = 1/n(a11+…+a1n), … , vmL = 1/n(am1+…+amn).
Сравнивая полученные значения, выбираем среди них наибольшее vL*=(v1L,…,vmL). Стратегия Аi*, соответствующая этому значению, объявляется оптимальной.
б) Принцип минимакса. Другой возможный подход связан с оценкой «природы» как разумного, причем агрессивного противника, стремящегося сделать средний выигрыш игрока А как можно меньше. В этом случае задачу поиска оптимальной стратегии игрок А должен решать обычными методами теории матричных игр, чему был посвящен предыдущий параграф.
Пример 2.9. Сельскохозяйственное предприятие планирует посев трех культур – А1, А2, А3. Считаем, что при прочих равных условиях урожаи культур зависят от погоды, а сама погода может иметь 3 различных состояния: В1- засушливое лето, В2 – нормальное лето, В3 – дождливое лето, Расчеты прибыли с/х предприятия (в у. е.) в зависимости от состояний погоды сведены в матрицу
.
Найти оптимальную стратегию предприятия, если: а) вероятности состояний В1, В2, В3 погоды известны q1=0.2, q2=0.3, q3=0.5; б) придерживаться принципа недостаточного основания Лапласа; в) ориентироваться на наименее благоприятную погоду.
Решение. Сразу заметим, что в рассматриваемой платежной матрице стратегия А1 доминируется стратегией А2 и, следовательно, может быть отброшена, как заведомо невыгодная с/х предприятию.
а) В данном случае смешанная стратегия «природы» известна SB=(0.2,0.3,0.5). Найдем средние прибыли предприятия при использовании им оставшихся стратегий А2 и А3: H(A2,SB)=80.2+50.3+30.5=4.6, H(A3,SB)=20.2+30.3+70.5=4.8. Второе значение больше, поэтому следует выбрать стратегию А3.
б) В силу отсутствия информации о состояниях «природы», априорно примем q1=q2=q3=1/3. В случае использования стратегий А2 и А3 получим следующие оценочные «выигрыши»: v2L=1/3(8+5+3)=16/3, v3L=1/3(2+3+7)=4. Здесь, напротив, больше первое значение, и оптимальной стратегией является А2.
в) Ориентация на наименее благоприятную погоду предполагает рассмотрение «природы» как разумного и равноправного противника, стремящегося минимизировать прибыль предприятия. Поэтому оптимальная стратегия предприятия может быть найдена обычными методами решения матричных игр, например, графическим методом. Опуская промежуточные расчеты, запишем лишь результат решения этой «игры»: SA=(2/3,1/3) - оптимальная смешанная стратегия предприятия, vS=13/34.33 - цена «игры». Интерпретировать этот результат можно следующим образом: с/х предприятию рекомендуется 2/3 всех площадей засеять культурой А2 и 1/3 площадей – культурой А3. При этом можно гарантировать среднюю прибыль в 4.33 у.е.
Случай 3. Предположим, что, как и в случае 2, ничего о состояниях природы неизвестно. Однако игра с «природой» проводится один лишь раз, так что употребление смешанных стратегий ни игроком А, ни «природой» не имеет смысла. В этом случае при поиске оптимального решения чаще всего используются критерии Вальда, Сэвиджа и Гурвица.
А) Критерий Вальда (максиминный критерий).
Игрок А исходит из пессимистической оценки ситуации и предполагает, что «природа» играет с ним в антагонистическую игру. Его цель -–гарантированный выигрыш или нижняя цена игры
Его оптимальная стратегия - максиминная стратегия Аi*, при которой достигается W (см. п.2.2).
Б) Критерий Сэвиджа (критерий минимального риска).
Риском
rij
игрока А при пользовании стратегией
Аi
в условиях состояния «природы» Bj
называется разность между максимально
возможным выигрышем игрока А при
данном состоянии природы и выигрышем
аij
при выбранной стратегии Аi
,
т. е. rij=jaij,
где
- максимальный элемент в j-м
столбце. Риск – это «плата за
отсутствие
информации». В результате получаем
матрицу, составленную из чисел rij,
- матрицу риска R.
Оптимальной стратегией по критерию Сэвиджа является та стратегия Аi* , при которой величина риска имеет минимальное значение в самой неблагоприятной ситуации:
В) Критерий Гурвица (критерий учета степени оптимизма).
Здесь представляется логичным, чтобы при выборе решения вместо двух крайностей в оценке событий ситуации придерживаться некоторого компромисса, учитывающего возможность как наихудшего, так и наилучшего поведения «природы». В соответствии с этим критерием следует выбрать ту стратегию Аi*, при которой достигается следующий максимум:
где t[0,1] – субъективный показатель оптимизма, обычно близкий к 0,5.
Заметим, что при t=0 (крайний пессимизм!) критерий Гурвица переходит в критерий Вальда.
Пример 2.10. Игра с «природой» задана матрицей
.
Найдите оптимальные стратегии, руководствуясь критериями Вальда, Сэвиджа и Гурвица с t=0.6.
Для применения перечисленных критериев удобнее выполнить предварительные расчеты в таблице:
|
В1 |
В2 |
В3 |
minj aij |
maxj aij |
A1 |
20 |
30 |
15 |
15 |
30 |
A2 |
75 |
20 |
35 |
20 |
75 |
A3 |
25 |
80 |
25 |
25 |
80 |
A4 |
85 |
5 |
45 |
5 |
85 |
j=maxi aij |
85 |
80 |
45 |
|
|
а) Критерий Вальда. Находим стратегию, обеспечивающую гарантированный выигрыш игроку А. Для этого находим нижнюю цену игры
Найденный максимум достигается при i=3, т.е., исходя из критерия Вальда, следует осуществлять стратегию А3.
б) Критерий Сэвиджа. Сначала составим матрицу рисков R . Для этого определяем максимальные элементы в каждом столбце матрицы Н (нижняя строка таблицы). Затем находим элементы матрицы R по формуле rij=jaij. Получим матрицу:
.
Затем
находим
Минимум достигается при i=2 и i=3. Значит, по критерию Сэвиджа оптимальными являются стратегии А2 и А3.
в) Критерий Гурвица с t=0.6. Найдем минимальные и максимальные числа в каждой строке матрицы Н (последние два столбца таблицы). Для каждого номера i=1, 2, 3, 4 находим значение:
при
t=0.6.
Имеем: G1=0.415+0.630=24, G2=0.420+0.675=53,
G3=0.425+0.680=58, G4=0.45+0.685=53.
Находим максимальное из полученных значений. Это – G3=58. Оно соответствует стратегии А3, которое и является оптимальной по критерию Гурвица.
Обобщая полученные результаты, можно, по-видимому, рекомендовать игроку А воспользоваться стратегией А3.