
- •Раздел 1. Общие понятия экономико-математического моделирования 6
- •Раздел 2. Линейные оптимизационные экономико-математические
- •Раздел 1
- •1.1. Понятие модели и процесса моделирования
- •1.2. Классификация моделей
- •1.3. Основные этапы математического моделирования
- •1.4. Особенности математического моделирования экономических систем
- •Раздел 2
- •2.1. Основные линейные оптимизационные задачи и их решение в среде excel
- •2.2. Многопродуктовая транспортная задача
- •2.3. Задача распределения кредита предприятиям с целью получения максимальной прибыли по процентам
- •2.4. Задача о назначениях и ее решение с помощью алгоритма венгерского метода
- •2.5. Задача коммивояжера (о переналадках оборудования) и ее решение с помощью алгоритма литтла
- •Раздел 3
- •3.1. Матричная модель планирования в. Леонтьева
- •3.2. Задача о нахождении равновесных цен на товары
- •3.3. Задача о максимизации суммарного конечного потребления товаров
- •Раздел 4
- •4.1. Общие принципы динамического программирования
- •Принцип оптимальности Беллмана
- •Уравнение Беллмана. Решение исходной задачи
- •4.2. Задача о кратчайшем расстоянии и ее решение методом динамического программирования
- •4.3. Задача о распределении средств и ее решение методом динамического программирования
- •4.4. Задача о замене оборудования и ее решение методом динамического программирования
- •Раздел 5
- •5.1. Основные элементы системы массового обслуживания (смо)
- •5.2. Расчет вероятностей состояний смо
- •5.3. Основные характеристики работы смо
- •Раздел 6
- •6.1. Понятие об игровых моделях
- •6.2. Платежная матрица. Нижняя и верхняя цена игры
- •6.3. Решение игр в смешанных стратегиях
- •6.4. Приведение матричной игры к задаче линейного программирования
- •6.5. Статистические игры
- •А) Случай известных априорных вероятностей qj состояний природы
- •Б) Случай неизвестных априорных вероятностей состояний природы
- •Раздел 7
- •7.1. Основные понятия теории управления запасами
- •7.2. Модель уилсона
- •7.3. Модель с конечной интенсивностью поступления заказа
- •7.4. Некоторые многономенклатурные модели
- •7.5. Страховой запас
- •Раздел 8
- •8.1. Сетевые графики и правила их построения
- •8.2. Расчет временных параметров сетевого графика
- •8.3. Оптимизация сетевого графика по времени
- •8.4. Оптимизация сетевого графика по ресурсам
- •Алгоритм оптимизации комплекса работ по распределению ресурсов
- •8.5. Оптимизационные задачи сетевого планирования по стоимости
- •Алгоритм оптимизации комплекса работ по стоимости
- •Вопросы к зачету
- •8. Общие принципы динамического программирования.
- •Литература
6.2. Платежная матрица. Нижняя и верхняя цена игры
Рассмотрим парную
конечную игру. Пусть игрок А
располагает m
личными стратегиями, которые обозначим
;
у игрока В
имеется n
стратегий:
.
В этом случае говорят, что игра имеет
размерность
.
В результате выбора игроками любой пары
стратегий
и
,
однозначно
определяется исход игры, т.е. выигрыш
игрока А
(положительный или отрицательный) и
проигрыш
игрока
В.
Предположим, что значения
известны для любой пары стратегий
.
Матрица
,
элементами которой являются выигрыши,
соответствующие стратегиям
и
называется платежной
матрицей
или матрицей
игры и может
быть представлена таблицей (табл. 6.2.1).
Таблица 6.2.1
|
|
|
… |
|
|
|
|
… |
|
|
|
|
… |
|
… |
… |
… |
… |
… |
|
|
|
… |
|
Пример 6.2.1. Составить платежную матрицу следующей игры: первый игрок А прячет в руке некоторое (четное или нечетное) количество мелких одинаковых предметов (орехи, камушки, монеты, …); второй игрок В отгадывает: является ли спрятанное число предметов парным («чет») или нет («нечет»). Если игрок В угадал, то игрок А платит 1 ден. ед. В; если игрок В не угадал, то он платит 1 ден. ед. А.
Решение.
Для иллюстрации задачи используем табл. 6.2.2.
Таблица 6.2.2
Стратегии игроков |
В |
||
чет |
нечет |
||
А |
чет |
–1 |
1 |
нечет |
1 |
–1 |
Таким образом, условия игры определяются платежной матрицей:
.
Ответ:
.
Рассмотрим игру с платежной матрицей и определим наилучшую среди стратегий . Выбирая стратегию , игрок А должен рассчитывать, что игрок В ответит на нее той из стратегий , при которой выигрыш для игрока А минимален.
Обозначим через
наименьший выигрыш игрока А
при выборе им стратегии
для всех возможных стратегий игрока В,
т.е.
(6.2.1)
Среди всех чисел
выберем
наибольшее:
.
Будем называть
нижней ценой
игры или
максиминным
выигрышем (максимином).
Это гарантированный выигрыш игрока А
при выборе любой стратегии игроком В.
Следовательно:
. (6.2.2)
Стратегия, соответствующая максимину, называется максиминной стратегией.
Игрок В
заинтересован в том, чтобы уменьшить
выигрыш игрока
А и, выбирая
стратегию
,
он учитывает максимально возможный при
этом выигрыш для А.
Обозначим через
наибольший проигрыш игрока В
при выборе им стратегии
для всех возможных стратегий игрока А,
т.е.
. (6.2.3)
Среди всех чисел
j
выберем наименьшее
и назовем
верхней ценой
игры или
минимаксным выигрышем (минимаксом).
Это гарантированный проигрыш игрока
В.
Следовательно:
.
(6.2.4)
Стратегия, соответствующая минимаксу, называется минимаксной стратегией.
Принцип, диктующий игрокам выбор наиболее «осторожных» минимаксной и максиминной стратегий, называется принципом минимакса.
Пример 6.2.1 (продолжение). Определить нижнюю и верхнюю цены игры в случае, если платежная матрица имеет вид:
.
Решение.
Представим решение задачи с помощью таблицы 6.2.3.
Таблица 6.2.3
|
|
|
|
|
–1 |
1 |
–1 |
|
1 |
–1 |
–1 |
|
1 |
1 |
–1 1 |
Таким образом,
нижняя цена игры
,
верхняя цена игры
,
т.е.
,
причем
.
Ответ: , .
Приведем без доказательства следующую теорему.
Теорема 6.2.1.
В матричной
игре нижняя чистая цена игры не превосходит
верхней чистой цены игры, т.е.
Если верхняя и
нижняя цены игры совпадают, то общее
значение верхней и нижней цены игры
называется
чистой ценой
игры, или
ценой игры.
Минимаксные стратегии, соответствующие
цене игры, являются оптимальными
стратегиями,
а их совокупность – оптимальным
решением, или
решением игры. В этом случае игрок А
получает максимальный гарантированный
выигрыш
,
а игрок В
добивается минимального гарантированного
проигрыша
.
Данная ситуация называется устойчивостью
решения или равновесием
по Нэшу,
т.е. ни одному
из участников игры не выгодно менять
свое поведение (стратегию) при условии,
что другой участник не изменяет своего
поведения.
Определение 6.2.1. Чистая стратегия игрока А – это возможный ход первого игрока, выбранный им с вероятностью, равной 1.
Пара чистых
стратегий
и
дает
оптимальное решение игры тогда и только
тогда, когда соответствующий ей элемент
является одновременно наибольшим в
своем столбце и наименьшим в своей
строке. Такая ситуация, если она
существует, называется седловой
точкой и
может быть задана в виде пары векторов:
,
.
Пример 6.2.2. Определить нижнюю и верхнюю цену игры, заданной платежной матрицей
Имеет ли игра седловую точку?
Решение.
Таблица 6.2.4
|
|
|
|
|
|
5 |
6 |
8 |
5 |
|
9 |
|
8 |
|
|
7 |
6 |
6 |
6 |
|
9 |
|
8 |
|
Здесь
Таким образом, цена игры
достигается в седловой точке
Ответ:
чистая цена игры
достигается в седловой точке
что соответствует паре векторов
и
.