- •Заочное обучение
- •Методические указания к выполнению контрольных работ для студентов заочной формы обучения
- •Указания к решению задач по теории игр
- •«Игры с природой»
- •Определение производственной программы предприятия в условиях риска и неопределенности с использованием матричных игр.
- •Задача 1. Варианты заданий
- •Задача 2. Вариант задания.
- •Задача 3. Вариант задания.
- •Основная литература
- •Дополнительная литература
Указания к решению задач по теории игр
Одним из первых, исследовавших в общей форме задачи линейного программирования, был Джон фон Нейман, знаменитый математик и физик, доказавший основную теорему о матричных играх и изучивший экономическую модель, носящую его имя.
Теория игр занимается разработкой рекомендаций по принятию решений в условиях конфликтной ситуации. Совокупность правил, однозначно определяющих последовательность действий стороны в конкретной конфликтной ситуации, называется стратегией. Под термином игра будем понимать совокупность предварительно оговоренных правил и условий, а термин партия связан с частичной возможной реализацией этих правил.
Пусть в игре
участвуют два игрока
.
В конце партии каждый игрок получает
сумму
,
которая называется выигрышем.
Каждый игрок руководствуется целью
максимизировать свой выигрыш. Числа
могут
быть как положительными, так и
отрицательными или равными нулю. Если
,
то это соответствует выигрышу i-го
игрока, если
- проигрышу, при
- исход ничейный. Игра называется с
нулевой суммой,
если
.
Мы будем рассматривать
матричные игры. В общем случае матричная
игра задается прямоугольной матрицей
A
размерности
,
которая называется платежной
матрицей.
.
Игроки независимо
друг от друга выбирают
- номера строки,
- номера столбца матрицы A.
Каждый элемент
матрицы A
представляет
собой выигрыш первого игрока и одновременно
- проигрыш второго. При этом первый игрок
стремится выбрать такую стратегию,
которая доставляет ему максимальный
выигрыш, а второй игрок выбирает
стратегию, приводящую его к минимальному
проигрышу.
Стратегии различают чистые и смешанные. Чистая стратегия первого игрока (или второго игрока)– это возможный ход первого (второго) игрока, выбранный им с вероятностью, равной 1. Первый игрок располагает, очевидно, m чистыми стратегиями, второй - n чистыми стратегиями. Чистые стратегии можно представить в виде единичных векторов
Седловой точкой
матрицы A
называется точка
,
если элемент
является наименьшим в своей строке и
наибольшим в своем столбце.
Если матрица
имеет седловую точку, то игра имеет
решение в чистых стратегиях. Число
называется чистой
ценой игры.
Пример 1. Установить наличие седловой точки в матричной игре с матрицей
.
В каждой строке матрицы находим минимальный элемент, а в каждом столбце – максимальный
-
9
5
6
7
5
1
4
3
8
1
6
3
2
-4
-4
9
5
6
8
Теперь среди всех минимальных элементов находим наибольший
,
а среди максимальных
– наименьшее значение
.
Так как их значения
совпадают, то матричная игра имеет
седловую точку (1,2) и цена игры равна
.
Оптимальная стратегия для первого
игрока
,
соответственно для второго -
.
Отклонение первого игрока от своей
оптимальной стратегии ведет к уменьшению
его выигрыша, а отклонение второго
игрока – к увеличению его проигрыша.
Смешанной стратегией первого игрока называется вектор
,
компоненты которого удовлетворяют
следующим условиям
.
Аналогично смешанной стратегией второго
игрока называется вектор
,
компоненты которого удовлетворяют
следующим условиям
.
Компоненты векторов p
и q
означают
вероятность применения i-ой
чистой стратегии первым игроком или j
–ой чистой
стратегии вторым игроком.
Игроки выбирают
свои чистые стратегии случайно и
независимо друг от друга. Поэтому игра
имеет случайный характер и величина
выигрыша становится случайной. Средняя
величина выигрыша есть математическое
ожидание
Функция f(p,q)
называется платежной
функцией
игры с матрицей A.
Стратегии
и
называются оптимальными,
если для произвольных стратегий p
и
q
выполняется условие
.
Совокупность
оптимальных стратегий и цена игры
составляют решение
игры. Значение
платежной функции при оптимальных
стратегиях определяет цену
игры
.
Таким образом, цена игры совпадает с математическим ожиданием выигрыша первого игрока (проигрыша второго) при условии, что оба игрока применяют свои оптимальные стратегии.
Теорема 1 (фон Неймана). В смешанных стратегиях любая конечная матричная игра имеет седловую точку.
Для того чтобы проверить, являются ли стратегии и оптимальными достаточно сравнить их с чистыми стратегиями игроков, которых, как известно, имеется конечное множество.
Решение матричной игры можно упростить, выявив доминирование одних стратегий над другими. Строка платежной матрицы называется доминируемой строкой, если все ее элементы не превосходят соответствующих элементов другой строки. Столбец платежной матрицы называется доминирующим столбцом, если все его элементы не меньше соответствующих элементов какого-либо другого столбца. С точки зрения первого игрока не имеет смысла выбирать доминируемую строку, а с точки зрения второго игрока - доминирующий столбец. Их можно удалить из платежной матрицы.
Теорема 2.
Оптимальные
стратегии
и
в матричной игре с матрицей
и ценой игры v
будут
оптимальными и в матричной игре с
матрицей
и ценой игры v+c.
Пример 2. Рассмотрим матричную игру, заданную платежной матрицей
Так как все элементы первой строки не больше соответствующих элементов третьей строки, то первая строка является доминируемой и ее можно удалить. Кроме того, сравнивая первый столбец и третий, а также первый и пятый, убеждаемся, что третий и пятый столбцы являются доминируемыми и их можно удалить. В результате получаем матрицу
.
Прибавив ко всем элементам этой матрицы число c=3, получаем матрицу, все элементы которой неотрицательны
.
Пусть мы имеем
игру с платежной матрицей
.
Обозначим
- оптимальные смешанные стратегии 1-го
и 2-го игроков, и v
– цена игры. Стратегия
первого игрока гарантирует ему выигрыш
не меньше v,
независимо от выбора стратегии вторым
игроком.
Любая матричная игра может быть сведена к паре симметричных двойственных ЗЛП.
2-й игрок
|
1-й игрок
|
Здесь введены следующие обозначения
Для отыскания оптимальных стратегий игроков и цены игры можно воспользоваться симплекс-методом. Если прямая задача имеет оптимальный план, который содержится в последней симплексной таблице, то и двойственная задача имеет оптимальный план. Этот план содержится в индексной строке последней симплексной таблицы.
Пример 3. Найти решение матричной игры, рассмотренной в примере 2.
Для матричной игры
с платежной матрицей
исходную задачу сведем к паре симметричных
двойственных задач
Задача 1
|
Задача 2
|
Теперь решим задачу 1 симплекс-методом.
-
Базис
П
θ
Шаг 0
0
1
5
0
7
1
0
1/5
0
1
2
4
1
0
1
1/2
f(x)=
0
-1
-1
-1
0
0
Шаг 1
1
1/5
1
0
7/5
1/5
0
-
0
3/5
0
4
-9/5
-2/5
1
f(x)=
1/5
0
-1
2/5
1/5
0
Шаг 2
1
1/5
1
0
7/5
1/5
0
1
3/20
0
1
-9/20
-1/10
1/4
-
f(x)=
7/20
0
0
-1/20
1/10
1/4
Шаг 3
1
1/7
5/7
0
1
1/7
0
1
3/14
9/28
1
0
-1/28
1/4
f(x)=
5/14
1/28
0
0
3/28
1/4
g(y)
В канонической
форме прямой задачи переменные
являются свободными, а дополнительные
переменные
- базисными. В канонической форме
двойственной задачи свободными будут
,
а базисными -
.
Соответствие между переменными следующее
Выпишем оптимальные планы пары двойственных задач.
,
причем
Из решений двойственных задач получаем
цену игры и оптимальные стратегии
игроков в матричной игре с матрицей
Игра с матрицей
имеет те же оптимальные стратегии
,
что и игра с матрицей
,
причем цена игры
Наконец исходная
игра с матрицей A
имеет
оптимальные стратегии
и цену игры
.
Оптимальные стратегии
получим из оптимальных стратегий
,
записав нули на месте удаленных строк
и столбцов.
