
- •5. Теория игр
- •5.1 Понятие об игровых моделях
- •5.1.1. Общие сведения
- •5.1.2. Основные понятия теории игр
- •5.1.3. Платежная матрица. Нижняя и верхняя цена игры
- •5.1.4. Решение игр в смешанных стратегиях
- •5.1.5. Геометрическая интерпретация игры 2х2
- •5.1.6. Приведение матричной игры к задаче линейного программирования
- •5.2. Теория игр. Смешанные стратегии. Решение игр методом линейного программирования
- •5.2.1. Основные понятия теории игр
- •5.2.2. Игра двух лиц с нулевой суммой
- •5.2.3. Решение игры
- •5.2.4. Смешанные стратегии и их свойства
- •5.2.5. Решение матричных игр в смешанных стратегиях путем сведения к паре двойственных задач
- •5.2.6. Этапы решения матричной игры
5.1.4. Решение игр в смешанных стратегиях
Если игра не имеет седловой точки, то применение чистых стратегий не дает оптимального решения игры. Так, в задаче №1 ,седловая точка отсутствует. В таком случае можно получить оптимальное решение, случайным образом чередуя чистые стратегии.
Смешанной стратегией SA
игрокаАназывается применение
чистых стратегийА1,
А2,…,
Аi,…,
Аmс вероятностямиp1, р2,…,pi,
..., pт,
причем сумма вероятностей равна
1:.
Смешанные стратегии
игрокаАзаписываются в виде матрицы
или в виде строки SA = (p1, р2,…,pi, ..., pт).Аналогично смешанные стратегии игрокаВобозначаются:
где сумма вероятностей появления
стратегий равна 1:
Чистые стратегии можно считать частным случаем смешанных и задавать строкой, в которой 1соответствует чистой стратегии. На основании принципа минимакса определяетсяоптимальное решение(илирешение)игры: это пара оптимальных стратегийS*A, S*Bв общем случае смешанных, обладающих следующим свойством: если один из игроков придерживается своей оптимальной стратегии, то другому не может быть выгодно отступать от своей. Выигрыш, соответствующий оптимальному решению, называется ценой игры v.Цена игры удовлетворяет неравенству:
(5.1.4.1)
где и —нижняя и верхняя цены игры.
Справедлива следующая основная теорема теории игр — теорема Неймана.Каждая конечная игра имеет по крайней мере одно оптимальное решение, возможно, среди смешанных стратегий.
Пусть S*A = (p*1, р*2,…, pт) иS*B = (q*1, q*2,…,q*n) — пара оптимальных стратегий. Если чистая стратегия входит в оптимальную смешанную стратегию с отличной от нуля вероятностью, то она называетсяактивной.
Справедлива теорема об активных стратегиях:если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш остается неизменным и равным цене игры v,если второй игрок не выходит за пределы своих активных стратегий.
Эта теорема имеет большое практическое значение —она дает конкретные модели нахождения оптимальных стратегий при отсутствии седловой точки.
Рассмотрим игру размера 2 х 2,которая является простейшим случаем конечной игры. Если такая игра имеет седловую точку, то оптимальное решение —это пара чистых стратегий, соответствующих этой точке.
Игра, в которой отсутствует седловая точка, в соответствии с основной теоремой теории игр оптимальное решение существует и определяется парой смешанных стратегий S*A = (p*1, р*2) и S*B = (q*1, q*2).
Для того чтобы их найти, воспользуемся теоремой об активных стратегиях. Если игрок Апридерживается своей оптимальной стратегииS*A,то его средний выигрыш будет равен цене игры v, какой бы активной стратегией ни пользовался игрокВ.Для игры 2х2любая чистая стратегия противника является активной, если отсутствует седловая точка. Выигрыш игрокаА(проигрыш игрокаВ) —случайная величина, математическое ожидание (среднее значение) которой является ценой игры. Поэтому средний выигрыш игрокаА(оптимальная стратегия) будет равенvи для 1-й, и для 2-й стратегии противника.
Пусть игра задана платежной матрицей
Средний
выигрыш игрока А,
если он использует оптимальную смешанную
стратегию
а
игрок В
—
чистую стратегию B1
(это соответствует 1-му столбцу платежной
матрицы Р),
равен
цене игры v:
Тот же средний выигрыш получает игрок А, если 2-й игрок применяет стратегиюВ2, т.е.а12р*1 +а22р*2 =v. Учитывая, чтор*1 +р*2 =1, получаем систему уравнений для определения оптимальной стратегииS*Aи цены игры v:
(5.1.4.2)
Решая эту систему, получим оптимальную стратегию
(5.1.4.3)
и цену игры
(5.1.4.4)
Применяя теорему об активных стратегиях при отыскании S*B —оптимальной стратегии игрокаВ,получаем, что при любой чистой стратегии игрокаА (А1илиА2)средний проигрыш игрокаВравен цене игры v,т.е.
(5.1.4.5)
Тогда оптимальная стратегия S*B = (q*1, q*2) определяется формулами:
(5.1.4.6)
Применим полученные результаты для отыскания оптимальных стратегий для игры, рассмотренной в примере 5.1.3.1.
Пример 5.1.4.1. Найти оптимальные стратегии игры, приведенной в примере 5.1.3.1.
Решение.Игра "поиск" задана платежной матрицей без седловой точки:
Поэтому ищем решение в смешанных стратегиях; для игрока А средний выигрыш равен цене игры v(приВ1иВ2); для игрокаВ средний проигрыш равен цене игры v(приА1иА2). Системы уравнений (6)и (9)в данном случае имеют вид:
Решая эти системы, получаем p*1=p*2= q*1= q*2= 1 / 2,v = 0.
Это означает, что оптимальная стратегия каждого игрока состоит в том, чтобы чередовать свои чистые стратегии случайным образом, выбирая каждое из убежищ с вероятностью 1/2,при этом средний выигрыш равен 0.