
- •Раздел 5. Основы теории игр
- •Раздел 1. Структура оптимизационной модели. Классификация моделей.
- •Раздел 2. Линейное программирование
- •Характеристика линейной оптимизационной модели. Примеры задач линейного программирования и графический метод их решения.
- •2 .2. Симплекс-метод
- •2.3. Теория двойственности в линейном программировании
- •Раздел 3. Нелинейное программирование.
- •3.1.Общая характеристика нелинейной оптимизационной модели.
- •3.2.Способы решения задач нелинейного программирования.
- •Раздел 4. Динамическое программирование.
- •4.1. Общая характеристика метода динамического программирования.
- •4.2. Задача транспортировки груза по сети дорог.
- •4.3.Задача распределения ресурсов.
- •4.4. Задача определения оптимальной политики замены оборудования.
- •Раздел 5. Основы теории игр.
- •5.1.Основные понятия теории игр. Парные матричные игры с нулевой суммой.
- •5.2. Методы решения матричных игр.
- •5.3. Статистические игры.
- •6. Основы теории управления запасами.
- •6.1.Основные понятия теории управления запасами.
- •6.2. Детерминированные модели управления запасами.
- •6.3. Стохастические модели управления запасами.
- •Раздел 7. Основы теории систем массового обслуживания.
- •7.1. Основные понятия теории систем массового обслуживания.
- •7.2. Основные характеристики функционирования смо с отказами.
- •7.3. Основные характеристики функционирования смо с очередью.
- •Нелинейное программирование
5.2. Методы решения матричных игр.
Если
в платежной матрице игры присутствует
такой элемент
,
что
,
то говорят, что у игры есть седловая
точка. В таком случае сам элемент
называют ценой игры. Для обозначения
цены игры введем особый символ
(ню). Цена игры и пара альтернатив игроков,
которая обеспечила данный исход игры,
составляют решение игры.
В случае с седловой точкой решение игры находится в чистых стратегиях. Чистой стратегией игрока именуется такой способ поведения, когда одна из альтернатив выбирается с единичной вероятностью, а остальные альтернативы – с нулевой.
Как
правило, в играх
,
поэтому решение большинства игр находят
в так называемых смешанных стратегиях.
Смешанной стратегией игрока называют
вектор, в котором каждая компонента
соответствует вероятности (или частоте)
выбора игроком соответствующей
альтернативы. Ни одна компонента такого
вектора не равна единице.
Обозначим смешанную
стратегию игрока А
,
а смешанную стратегию игрока В
.
При
использовании смешанных стратегий игра
приобретает случайный характер, случайной
величиной становится также и ее общий
результат, который можно определить по
формуле
.
Функцию
называют
платежной.
Смешанные стратегии
и
являются оптимальными, если они образуют
седловую точку для платежной функции
игры. Это означает, что данные стратегии
удовлетворяют неравенству
.
Смысл данного неравенства таков: если А следует своей оптимальной смешанной стратегии, то независимо от стратегии В он получает выигрыш, не меньший чем цена игры; если В следует своей оптимальной смешанной стратегии, то независимо от стратегии А он получает проигрыш, не больший чем цена игры. Значение платежной функции от оптимальных смешанных стратегий является ценой игры
.
Собственно решение начинается с упрощения платежной матрицы и изменения ее элементов. Упрощение состоит в исключении дублирующих (одинаковых по набору исходов) и доминируемых ( менее предпочитаемых с позиций удовлетворения интересов игрока) стратегий. Изменение элементов платежной матрицы состоит в том, чтобы сделать их целыми неотрицательными числами. В решении будем пользоваться упрощенной и видоизмененной матрицей. Решение осуществляется путем сведения игры к задаче линейного программирования на основе использования приведенного выше основного неравенства теории игр.
Воспользуемся левой частью этого неравенства, которую можно описать системой неравенств:
Для объяснения хода решения воспользуемся также матричной формой описания игры
При
этом
,
так как компонентами вектора являются
вероятности полного набора возможных
событий.
Разделим каждое
неравенство системы и сумму компонентов
вектора вероятностей на положительное
число
.
Поскольку элементы платежной матрицы
можно сделать положительными числами,
то можно сделать положительным и
.
Введем обозначение
.
Так как игрок B
стремится минимизировать исход
,
то он максимизирует
Решение данной задачи позволит получить , на основе которых вычисляются компоненты оптимального вектора и цена игры. На основе двойственных оценок получаем оптимальный вектор .