Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СППР лекции (окончательные).docx
Скачиваний:
2
Добавлен:
01.07.2025
Размер:
455.49 Кб
Скачать

Тема 1. Матричные игры Лекция 1. Матричные игры

В экономике и управлении встречаются ситуации, когда сталкиваются две и более стороны, преследующие различные цели. Причем результат, полученный каждой из сторон при реализации определенной стратегии, зависит от действий других сторон. Такие ситуации называются конфликтными.

Примеры: борьба фирм за рынок сбыта, аукцион, спортивные состязания, военные операции, парламентские выборы при наличии нескольких кандидатов, карточные игры.

Простейшим примером конфликтной ситуации является игра с нулевой суммой или антагонистическая игра, в которой выигрыш одной стороны конфликта в точности совпадает с проигрышем другой стороны.

Рассмотрим конфликт двух участников с противоположными интересами, математической моделью которого является игра с нулевой суммой. Участники игры – лица, принимающие решения, - называются игроками. Стратегия игрока – осознанный выбор одного из множества возможных вариантов его действий. Рассмотрим конечные игры, в которых множества стратегий игроков конечны: стратегии первого игрока пронумеруем числами от 1 до m, стратегии второго игрока – от 1 до n.

Если первый игрок выбрал свою i-ую стратегию, а второй игрок – свою j-тую стратегию, то результатом такого совместного выбора будет платеж второго игрока первому. В качестве платежа может выступать не только денежная сумма, но и оценка полезности результата выбора игроками своих стратегий i и j. Таким образом, конечная игра с нулевой суммой однозначно определяется матрицей

, (1.1)

которая называется платежной матрицей или матрицей выигрышей. Строки этой матрицы соответствуют стратегиям первого игрока, а столбцы – стратегиям второго игрока. Конечные игры с нулевой суммой называются матричными, т.к. целиком определяются своими платежными матрицами.

Игра происходит партиями. Партия игры состоит в том, что игроки одновременно называют свой выбор: первый игрок называет некоторый номер строки матрицы А, а второй игрок - некоторый номер столбца этой матрицы (по своему выбору или случайно). После этого происходит «расплата». Пусть первый игрок назвал номер i, а второй – j. Тогда второй игрок платит первому сумму , и партия игры заканчивается. Если , то это означает, что при выборе первым игроком i-й стратегии, а вторым – j-й, выигрывает первый игрок; если , то выигрывает второй игрок. Цель каждого игрока – выиграть как можно большую сумму в результате большого числа партий.

Смысл названий «конфликт с противоположными интересами» и «игра с нулевой суммой» состоит в том, что выигрыш каждого из игроков противоположен выигрышу противника, т.е. сумма выигрышей игроков равна нулю.

Стратегия называется чистой, если выбор игрока неизменен от партии к партии. У первого игрока есть m чистый стратегий, у второго – n.

При анализе игр противник считается сильным, т.е. разумным.

Рассмотрим описанную конфликтную ситуацию с точки зрения первого игрока. Если первый игрок выбирает свою i-ую стратегию или i-ую строку матрицы А, то второй игрок, будучи разумным, выберет такую стратегию j, которая обеспечит ему наибольший выигрыш, а первому игроку соответственно наименьший, т.е. второй игрок выберет такой столбец j матрицы А, в котором платеж второго игрока первому минимален. Перебирая все свои стратегии i=1, 2, …m и первый игрок выбирает ту из них, при которой второй игрок, действуя максимально разумно, заплатит ему наибольшую сумму.

Величина называется нижней ценой игры, а соответствующая ей стратегия первого игрока – максиминной.

Аналогичные рассуждения с точки зрения второго игрока определяют верхнюю цену игры и соответствующую ей минимаксную стратегию второго игрока.

Нижняя цена игры представляет собой максимальный гарантированный выигрыш первого игрока, т.е. первый игрок обеспечивает себе выигрыш не меньше , а верхняя цена игры – минимальный гарантированный проигрыш второго игрока, т.е. второй игрок обеспечивает себе проигрыш не больше или выигрыш не меньше (- .

Если , то говорят, что игра имеет седловую точку в чистых стратегиях, общее значение и называется ценой игры и обозначается . При этом стратегии игроков, соответствующие седловой точке, называются оптимальными чистыми стратегиями, т.к. эти стратегии являются наиболее выгодными сразу для обоих игроков, обеспечивая первому – гарантированный выигрыш не менее v, а второму – гарантированный проигрыш не более –v, Отклонение от этих стратегий не выгодно.

Пример 1.1. В платежной матрице

Указано, какую долю рынка выиграет предприятие у своего единственного конкурента, если оно будет действовать согласно каждой из возможных трех стратегий, а конкурент – согласно каждой из своих возможных трех стратегий. Определить, имеет ли данная игра седловую точку в чистых стратегиях.

Решение. Припишем справа от строк платежной матрицы минимальные элементы этих строк (соответствующие выигрышу первого игрока в том случае, когда он выберет стратегию, соответствующую данной строке, а второй игрок при этом выберет стратегию, соответствующую наилучшему для него выигрышу); под столбцами платежной матрицы напишем максимальные элементы этих столбцов (соответствующие проигрышу второго игрока в том случае, когда он выберет стратегию, соответствующую данному столбцу, а первый игрок при этом выберет стратегию соответствующую наилучшему для него выигрышу):

||

Нижняя цена игры , соответствует второй стратегии первого игрока.

Верхняя цена игры , соответствует третьей стратегии второго игрока, поэтому если первый игрок будет действовать со второй стратегией, а второй игрок – с третьей, то игроки могут гарантировать себе: первый – выигрыш не менее рынка, а второй – что первый выиграет не более рынка.

Таким образом, данная игра имеет седловую точку в чистых стратегиях (в платежной матрице седловая точка обведена рамкой), при этом оптимальная чистая стратегия первого игрока – вторая, оптимальная чистая стратегия второго игрока – третья, а цена игры равна .

Если первый игрок будет следовать своей оптимальной чистой стратегии (второй), а второй игрок отклонится от своей оптимальной чистой стратегии (третьей), то он ухудшит свое положение и будет проигрывать не 30%, а 50% или 40% рынка. Первому игроку также невыгодно отклоняться от своей второй стратегии, если второй игрок будет придерживаться третьей.

Матричная игра не всегда имеет седловую точку в чистых стратегиях.

Пример 1.2 Игра «Угадывание монеты». Правила игры следующие: первый игрок прячет в кулаке одну из двух монет – 1 руб. или 5 руб. – по своему выбору и незаметно от второго игрока, а второй игрок пытается угадать, какая монета спрятана. Если угадывает, то получает эту монету, если нет, то платит первому игроку 3 руб. Доказать, что данная игра не имеет седловой точки в чистых стратегиях.

Решение. Платежная матрица имеет вид:

Нижняя цена игры .

Верхняя цена игры .

Таким образом, и седловой точки в чистых стратегиях в игре нет.

Теорема. В любой матричной игре нижняя цена не превосходит верхнюю цену игры: .

Доказательство. Любой элемент платежной матрицы не меньше минимального элемента i-й строки: и не больше максимального элемента j-го столбца: . Таким образом, , откуда . Левая часть этого неравенства зависит от номера строки i, а правая часть не зависит, поэтому для любого столбца j или (одновременно для всех j). Но это означает, что или , что и требовалось доказать.

Рассмотрим ситуацию, когда нижняя цена игры строго меньше верхней, т.е. когда в игре отсутствует седловая точка.

Смешанной стратегией первого игрока называется вектор , где все ( ), а . При этом – вероятность, с которой первый игрок выбирает свою i-ую стратегию. Аналогично определяется смешанная стратегия

второго игрока. Чистая стратегия также подпадает под определение смешанной – в этом случае все вероятности равны нулю, кроме одной, равной единице.

Математическое ожидание дискретной случайной величины – это взвешенное среднее всех ее возможных значений, причем в качестве весового коэффициента берется вероятность соответствующего исхода, т.е. сумма произведений всех возможных значений случайной величины на их вероятности.

Предположим, что х может принимать n конкретных значений ( ) и что вероятность получения хi равна pi. Тогда =

Пример. Число очков, выпадающее при бросании одной игральной кости. В данном случае возможны шесть исходов, каждый из которых имеет вероятность 1/6, поэтому

Математическое ожидание случайной величины часто называют ее средним по генеральной совокупности. Для случайной величины х это значение часто обозначается как µ.

Если игроки играют со своими смешанными стратегиями и соответственно, то математическое ожидание выигрыша первого игрока равно:

И совпадает с математическим ожиданием проигрыша второго игрока.

Стратегии и называются оптимальными смешанными стратегиями соответственно первого и второго игрока, если

.

Если у обоих игроков есть оптимальные смешанные стратегии, то пара называется решением игры (или седловой точкой в смешанных стратегиях), а число

- ценой игры.

Теорема фон Неймана. Каждая конечная матричная игра имеет, по крайней мере, одно оптимальное решение, возможно, среди смешанных стратегий.