- •Введение Решения в условиях определенности, риска и неопределенности
- •Тема 1. Матричные игры Лекция 1. Матричные игры
- •Лекция 2. Матричные игры (продолжение) Дублирование и доминирование стратегий
- •Решение игры
- •Решение игры
- •Решение игры
- •Лекция 3. Матричные игры (продолжение)
- •Приближенный метод решения матричных игр
- •Лекция 4. Принятие решений в условиях неопределенности
- •Критерий Лапласа:
- •Лекция 6. Биматричные игры
- •Непрерывные игры
- •Позиционные игры
- •Контрольные вопросы и задания
Тема 1. Матричные игры Лекция 1. Матричные игры
В экономике и управлении встречаются ситуации, когда сталкиваются две и более стороны, преследующие различные цели. Причем результат, полученный каждой из сторон при реализации определенной стратегии, зависит от действий других сторон. Такие ситуации называются конфликтными.
Примеры: борьба фирм за рынок сбыта, аукцион, спортивные состязания, военные операции, парламентские выборы при наличии нескольких кандидатов, карточные игры.
Простейшим примером конфликтной ситуации является игра с нулевой суммой или антагонистическая игра, в которой выигрыш одной стороны конфликта в точности совпадает с проигрышем другой стороны.
Рассмотрим конфликт двух участников с противоположными интересами, математической моделью которого является игра с нулевой суммой. Участники игры – лица, принимающие решения, - называются игроками. Стратегия игрока – осознанный выбор одного из множества возможных вариантов его действий. Рассмотрим конечные игры, в которых множества стратегий игроков конечны: стратегии первого игрока пронумеруем числами от 1 до m, стратегии второго игрока – от 1 до n.
Если
первый игрок выбрал свою i-ую
стратегию, а второй игрок – свою j-тую
стратегию, то результатом такого
совместного выбора будет платеж
второго игрока первому. В качестве
платежа может выступать не только
денежная сумма, но и оценка полезности
результата выбора игроками своих
стратегий i
и j.
Таким образом, конечная игра с нулевой
суммой однозначно определяется матрицей
, (1.1)
которая называется платежной матрицей или матрицей выигрышей. Строки этой матрицы соответствуют стратегиям первого игрока, а столбцы – стратегиям второго игрока. Конечные игры с нулевой суммой называются матричными, т.к. целиком определяются своими платежными матрицами.
Игра
происходит партиями. Партия
игры
состоит в том, что игроки одновременно
называют свой выбор: первый игрок
называет некоторый номер строки матрицы
А,
а второй игрок - некоторый номер столбца
этой матрицы (по своему выбору или
случайно). После этого происходит
«расплата». Пусть первый игрок назвал
номер i,
а второй – j.
Тогда второй игрок платит первому сумму
,
и партия игры заканчивается. Если
,
то это означает, что при выборе первым
игроком i-й
стратегии, а вторым – j-й,
выигрывает первый игрок; если
,
то выигрывает второй игрок. Цель каждого
игрока – выиграть как можно большую
сумму в результате большого числа
партий.
Смысл названий «конфликт с противоположными интересами» и «игра с нулевой суммой» состоит в том, что выигрыш каждого из игроков противоположен выигрышу противника, т.е. сумма выигрышей игроков равна нулю.
Стратегия называется чистой, если выбор игрока неизменен от партии к партии. У первого игрока есть m чистый стратегий, у второго – n.
При анализе игр противник считается сильным, т.е. разумным.
Рассмотрим описанную конфликтную ситуацию с точки зрения первого игрока. Если первый игрок выбирает свою i-ую стратегию или i-ую строку матрицы А, то второй игрок, будучи разумным, выберет такую стратегию j, которая обеспечит ему наибольший выигрыш, а первому игроку соответственно наименьший, т.е. второй игрок выберет такой столбец j матрицы А, в котором платеж второго игрока первому минимален. Перебирая все свои стратегии i=1, 2, …m и первый игрок выбирает ту из них, при которой второй игрок, действуя максимально разумно, заплатит ему наибольшую сумму.
Величина
называется нижней ценой игры, а
соответствующая ей стратегия первого
игрока – максиминной.
Аналогичные
рассуждения с точки зрения второго
игрока определяют верхнюю цену игры
и соответствующую ей минимаксную
стратегию второго игрока.
Нижняя
цена игры
представляет собой максимальный
гарантированный выигрыш первого игрока,
т.е. первый игрок обеспечивает себе
выигрыш не меньше
,
а верхняя цена игры
– минимальный гарантированный проигрыш
второго игрока, т.е. второй игрок
обеспечивает себе проигрыш не больше
или выигрыш не меньше (-
.
Если
,
то говорят, что игра имеет седловую
точку в чистых стратегиях, общее значение
и
называется ценой игры и обозначается
.
При этом стратегии игроков, соответствующие
седловой точке, называются оптимальными
чистыми стратегиями, т.к. эти стратегии
являются наиболее выгодными сразу для
обоих игроков, обеспечивая первому –
гарантированный выигрыш не менее v,
а второму – гарантированный проигрыш
не более –v,
Отклонение от этих стратегий не выгодно.
Пример 1.1. В платежной матрице
Указано, какую долю рынка выиграет предприятие у своего единственного конкурента, если оно будет действовать согласно каждой из возможных трех стратегий, а конкурент – согласно каждой из своих возможных трех стратегий. Определить, имеет ли данная игра седловую точку в чистых стратегиях.
Решение. Припишем справа от строк платежной матрицы минимальные элементы этих строк (соответствующие выигрышу первого игрока в том случае, когда он выберет стратегию, соответствующую данной строке, а второй игрок при этом выберет стратегию, соответствующую наилучшему для него выигрышу); под столбцами платежной матрицы напишем максимальные элементы этих столбцов (соответствующие проигрышу второго игрока в том случае, когда он выберет стратегию, соответствующую данному столбцу, а первый игрок при этом выберет стратегию соответствующую наилучшему для него выигрышу):
||
Нижняя
цена игры
,
соответствует второй стратегии первого
игрока.
Верхняя
цена игры
,
соответствует третьей стратегии второго
игрока, поэтому если первый игрок будет
действовать со второй стратегией, а
второй игрок – с третьей, то игроки
могут гарантировать себе: первый –
выигрыш не менее
рынка, а второй – что первый выиграет
не более
рынка.
Таким
образом, данная игра имеет седловую
точку в чистых стратегиях (в платежной
матрице седловая точка обведена рамкой),
при этом оптимальная чистая стратегия
первого игрока – вторая, оптимальная
чистая стратегия второго игрока –
третья, а цена игры равна
.
Если первый игрок будет следовать своей оптимальной чистой стратегии (второй), а второй игрок отклонится от своей оптимальной чистой стратегии (третьей), то он ухудшит свое положение и будет проигрывать не 30%, а 50% или 40% рынка. Первому игроку также невыгодно отклоняться от своей второй стратегии, если второй игрок будет придерживаться третьей.
Матричная игра не всегда имеет седловую точку в чистых стратегиях.
Пример 1.2 Игра «Угадывание монеты». Правила игры следующие: первый игрок прячет в кулаке одну из двух монет – 1 руб. или 5 руб. – по своему выбору и незаметно от второго игрока, а второй игрок пытается угадать, какая монета спрятана. Если угадывает, то получает эту монету, если нет, то платит первому игроку 3 руб. Доказать, что данная игра не имеет седловой точки в чистых стратегиях.
Решение. Платежная матрица имеет вид:
Нижняя
цена игры
.
Верхняя
цена игры
.
Таким
образом,
и седловой точки в чистых стратегиях в
игре нет.
Теорема.
В
любой матричной игре нижняя цена не
превосходит верхнюю цену игры:
.
Доказательство.
Любой
элемент
платежной матрицы не меньше минимального
элемента i-й
строки:
и не больше максимального элемента j-го
столбца:
.
Таким образом,
,
откуда
.
Левая часть этого неравенства зависит
от номера строки i,
а правая часть не зависит, поэтому для
любого столбца j
или
(одновременно для всех j).
Но это означает, что
или
,
что и требовалось доказать.
Рассмотрим ситуацию, когда нижняя цена игры строго меньше верхней, т.е. когда в игре отсутствует седловая точка.
Смешанной
стратегией первого игрока называется
вектор
,
где все
(
),
а
.
При этом
– вероятность, с которой первый игрок
выбирает свою
i-ую
стратегию. Аналогично определяется
смешанная стратегия
второго
игрока. Чистая стратегия также подпадает
под определение смешанной – в этом
случае все вероятности равны нулю, кроме
одной, равной единице.
Математическое ожидание дискретной случайной величины – это взвешенное среднее всех ее возможных значений, причем в качестве весового коэффициента берется вероятность соответствующего исхода, т.е. сумма произведений всех возможных значений случайной величины на их вероятности.
Предположим,
что х
может принимать n
конкретных значений (
)
и что вероятность получения хi
равна
pi.
Тогда
=
Пример. Число очков, выпадающее при бросании одной игральной кости. В данном случае возможны шесть исходов, каждый из которых имеет вероятность 1/6, поэтому
Математическое ожидание случайной величины часто называют ее средним по генеральной совокупности. Для случайной величины х это значение часто обозначается как µ.
Если игроки играют со своими смешанными стратегиями и соответственно, то математическое ожидание выигрыша первого игрока равно:
И совпадает с математическим ожиданием проигрыша второго игрока.
Стратегии
и
называются оптимальными
смешанными стратегиями
соответственно первого и второго игрока,
если
.
Если
у обоих игроков есть оптимальные
смешанные стратегии, то пара
называется решением
игры
(или седловой
точкой в смешанных стратегиях),
а число
-
ценой
игры.
Теорема фон Неймана. Каждая конечная матричная игра имеет, по крайней мере, одно оптимальное решение, возможно, среди смешанных стратегий.
