Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Пособие_ЭММ_док.doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
4.45 Mб
Скачать

5.2. Методы решения матричных игр.

Если в платежной матрице игры присутствует такой элемент , что , то говорят, что у игры есть седловая точка. В таком случае сам элемент называют ценой игры. Для обозначения цены игры введем особый символ (ню). Цена игры и пара альтернатив игроков, которая обеспечила данный исход игры, составляют решение игры.

В случае с седловой точкой решение игры находится в чистых стратегиях. Чистой стратегией игрока именуется такой способ поведения, когда одна из альтернатив выбирается с единичной вероятностью, а остальные альтернативы – с нулевой.

Как правило, в играх , поэтому решение большинства игр находят в так называемых смешанных стратегиях. Смешанной стратегией игрока называют вектор, в котором каждая компонента соответствует вероятности (или частоте) выбора игроком соответствующей альтернативы. Ни одна компонента такого вектора не равна единице.

Обозначим смешанную стратегию игрока А , а смешанную стратегию игрока В . При использовании смешанных стратегий игра приобретает случайный характер, случайной величиной становится также и ее общий результат, который можно определить по формуле . Функцию называют платежной.

Смешанные стратегии и являются оптимальными, если они образуют седловую точку для платежной функции игры. Это означает, что данные стратегии удовлетворяют неравенству

.

Смысл данного неравенства таков: если А следует своей оптимальной смешанной стратегии, то независимо от стратегии В он получает выигрыш, не меньший чем цена игры; если В следует своей оптимальной смешанной стратегии, то независимо от стратегии А он получает проигрыш, не больший чем цена игры. Значение платежной функции от оптимальных смешанных стратегий является ценой игры

.

Собственно решение начинается с упрощения платежной матрицы и изменения ее элементов. Упрощение состоит в исключении дублирующих (одинаковых по набору исходов) и доминируемых ( менее предпочитаемых с позиций удовлетворения интересов игрока) стратегий. Изменение элементов платежной матрицы состоит в том, чтобы сделать их целыми неотрицательными числами. В решении будем пользоваться упрощенной и видоизмененной матрицей. Решение осуществляется путем сведения игры к задаче линейного программирования на основе использования приведенного выше основного неравенства теории игр.

Воспользуемся левой частью этого неравенства, которую можно описать системой неравенств:

Для объяснения хода решения воспользуемся также матричной формой описания игры

При этом , так как компонентами вектора являются вероятности полного набора возможных событий.

Разделим каждое неравенство системы и сумму компонентов вектора вероятностей на положительное число . Поскольку элементы платежной матрицы можно сделать положительными числами, то можно сделать положительным и . Введем обозначение . Так как игрок B стремится минимизировать исход , то он максимизирует

Решение данной задачи позволит получить , на основе которых вычисляются компоненты оптимального вектора и цена игры. На основе двойственных оценок получаем оптимальный вектор .