Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЭМММ.docx
Скачиваний:
19
Добавлен:
07.12.2018
Размер:
74.04 Кб
Скачать

Решение матричных игр в чистых стратегиях (принцип минимакса)

Количественная оценка результатов игры называется платежом. Платежи отражают исход игры. С точки зрения математики исход игры – значение некоторой функции, которая называется функцией выигрыша или платёжной функцией. Платёжная функция определяет для каждой совокупности выбранных игроками стратегий выигрыш каждой из сторон. Платёжная функция может быть представлена таблицей, матрицей или аналитическим выражением.

Пример. Пусть имеются 2 игрока, каждый из которых может записать независимо от другого цифры 1, 2 и 3. Если разность между цифрами, записанными игроками больше 0, то первый игрок выигрывает количество очков, равное разности. Если разность меньше 0, то выигрывает второй игрок. Если разность равна 0, то игра заканчивается вничью. Необходимо дать рекомендации игрокам, какую из стратегий считать оптимальной.

Решение. Разработаем стратегии игроков. У игрока A, В - 3 стратегии. Составим матрицу платёжной таблицы

A, B

B1

B2

B3

A1

0

-1

-2

A2

1

0

-1

A3

2

1

0

Найдём наилучшую стратегию первого игрока A. Для этого определим минимальное число Aij в каждой строке и обозначим его как ai. Справедливо, что игрок A выберет ту свою стратегию, для которой величина ai максимальна. Таким образом, для определения величины выигрыша игрока A воспользуемся следующими формулами:

ai=min aij (i=1,m)

a=max ai=max min aij

Величина a – гарантированный выигрыш игрока A или нижняя цена игры (максимин). Соответствующая данной величине стратегия игрока A (строка) называется максимином. Проведём аналогичные рассуждения по поводу действий игрока B. С его точки зрения в платёжной матрице приведены его проигрыши. В каждом столбце он должен найти максимальное значение проигрыша при выборе своей стратегии Bj, а затем минимизировать величину проигрыша при любых действиях соперника. Представим эти рассуждения в виде формул.

Bj=max aij (j=1,n)

Bj – максимальные проигрыши игрока B при выборе стратегии Bj.

B=min Bj=min max aij

Величина B – верхняя цена игры (минимакс). Соответствующая ей стратегия игрока B (столбец) называется минимаксной. Если второй игрок будет придерживаться своей минимаксной стратегии, то ему гарантировано, что в любом случае он проиграет не больше B. Одна из теорем теории игр утверждает, что нижняя цена игры всегда не превосходит верхней цены игры.

a<B

Игра для которой a=B называется игрой с Седловой точкой. Для такой игры нахождение решения состоит в выборе максиминной и минимаксной стратегий, которые являются оптимальными. Такая игра имеет чистую цену игры: j=a=B. Стратегия Ai* и Bj* позволяют достичь этого значения, называются оптимальными, а пара оптимальных стратегий называется Седловой точкой матричной игры.

Таким образом, решив игру с Седловой точкой, необходимо каждому игроку применять одну свою стратегию. Тогда игроку A гарантировано, что он получит выигрыш, не меньший чистой цены игры . Игроку B гарантировано, что он получит проигрыш, не больший чистой цены игры . Решение игры записывается тройкой значений (Ai*; Bj*,j). Для решения примера добавим ещё один столбец и ещё одну строку к платёжной матрице

A, B

B1

B2

B3

ai

A1

0

-1

-2

-2

A2

1

0

-1

-1

A3

2

1

0*

0

Bj

2

1

0

X

Определим минимальные элементы по каждой строке и запишем их в столбце ai. Из этих величин найдём максимальное значение и обозначим его как a – нижняя цена игры.

a=max ai=max (-2; -1; 0)=0. a соответствует стратегии первого игрока A3. Найдём максимальные значения проигрышей Bj по каждому столбцу. Из значений Bj выберем минимальное и обозначим его как B. B=min Bj=min (2; 1; 0)=0. B – верхняя цена игры. Она соответствует стратегии второго игрока B3. Так как a=B, то данная игра является игрой с Седловой точкой и может быть решена в чистых стратегиях, то есть a=B=y. Чистая стратегия y=0. Оптимальными стратегиями игроков A и B являются стратегии A3* и B3*. Точка пересечения стратегий называется Седловой точкой игры, а соответствующий ей элемент платёжной матрицы называется Седловым элементом (a33). Решение игры A3*; B3*; 0. Мы рекомендуем игроку A придерживаться своей чистой стратегии A3, игроку B придерживаться чистой стратегии B3 и тогда при многократном повторении игры первый игрок выиграет 0, а второй игрок проиграет 0.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]