Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Исследование операций - лекции.docx
Скачиваний:
1
Добавлен:
01.03.2025
Размер:
201.24 Кб
Скачать

Пример решения задачи на нахождение оптимальных смешанных стратегий

Решим задачу из примера 2. Напомним ее формулировку: игроки A и В одновременно и независимо друг от друга записывают одно из трех чисел: либо «1», либо «2», либо «3». Если сумма записанных чисел оказывается четной, то игрок B платит игроку A эту сумму. Если сумма нечетная, то эту сумму выплачивает игрок A игроку В.

Матрица игры:

Bj

Ai

B1

B2

B3

минимум

в строках

αi

A1

2

–3

4

–3

максимин

A2

–3

4

–5

–5

A3

4

–5

6

–5

максимум

в столбцах βj

4

4

6

минимакс

Седловая точка отсутствует (минимакс не равен максимину), поэтому оптимальными в этой игре будут не чистые, а смешанные стратегии, заключающиеся в случайном выборе игроками стратегий с определенными вероятностями. Определим эти вероятности.

Чтобы использовать рассмотренный выше метод решения, необходимо, чтобы цена игры была положительной. Для этого достаточно добавить к каждому элементу матрицы такое число, чтобы нижняя цена игры α (максимин) стала положительной. Смысл этого действия – не допустить возможность получения решения ν = 0, поскольку в дальнейшем необходимо использовать величину 1/ν. Поскольку ν не меньше нижней цены игры (ν ≥ α), то при α > 0 цена игры ν также будет больше нуля.

Добавим к каждому элементу матрицы значение 4. При этом цена игры увеличится на 4, но оптимальные стратегии от этого не изменятся. Получим матрицу M:

Найдем смешанную стратегию игрока A: Как показано выше, для этого необходимо решить оптимизационную задачу:

при ограничениях

Данная задача решается с помощью методов линейного программирования. Для решения можно воспользоваться системами компьютерной математики. Например, используя функцию linprog системы MATLAB, получаем решение:

x1 = 0.0625,

x2 = 0.1250,

x3 = 0.0625.

Учитывая, что , получаем: , откуда ν = 4. Подставляя ν в выражения

получаем

p1 = 1/4,

p2 = 1/2,

p3 = 1/4.

Поскольку при определении оптимальной стратегии мы добавили к каждому элементу матрицы игры значение 4, вычтем его из полученного значения ν и получим истинную цену игры (средний выигрыш):

ν = 0.

Итак, если игрок A при многократном повторении игры будет придерживаться оптимальной смешанной стратегии

заключающейся в том, что A будет случайным образом выбирать в половине партий стратегию A2, в четверти партий – A1 и еще в четверти партий – A3, а противник B также будет придерживаться своей оптимальной стратегии, то игрок A в среднем ничего не выиграет и ничего не проиграет ("справедливая игра"). Если же противник B отклонится от своей оптимальной стратегии, то A может в среднем даже выиграть.

Определим теперь для игрока B оптимальную смешанную стратегию и убедимся, что цена игры будет той же самой. Для этого необходимо решить оптимизационную задачу:

при ограничениях

Решение этой задачи:

y1 = 0.0625,

y2 = 0.1250,

y3 = 0.0625,

.

(Решение для игрока B совпало с решением для игрока A в силу того, что матрица игры симметричная. В общем случае при несимметричной матрице игры решения не обязаны совпадать.)

Вероятности для игрока B:

q1 = 1/4,

q2 = 1/2,

q3 = 1/4.

Цена игры (после вычитания добавленного значения 4):

ν = 0.

Итак, оптимальные смешанные стратегии для игроков:

Если при проведении серии игр игроки будут придерживаться этих оптимальных смешанных стратегий, то в среднем никто не выиграет и не проиграет. Если один из игроков отклонится от своей оптимальной стратегии, то другой игрок получит преимущество.