
- •Содержание
- •Предисловие
- •Введение
- •Глава I. Балансовые модели балансовые модели. Модель Леонтьева многоотраслевой экономики. Продуктивные модели
- •Балансовая модель Леонтьева-Форда
- •Глава II. Модели линейного программирования Задачи математического и линейного программирования. Модели линейного программирования
- •Геометрический метод решения задач линейного программирования
- •Симплекс-метод для решения задач линейного программирования
- •Симплекс-таблицы для решения задач линейного программирования. Метод искусственного базиса (м-метод)
- •Взаимно двойственные задачи линейного программирования. Первая и вторая теоремы двойственности
- •Транспортная задача. Распределительный метод
- •Модели целочисленного линейного программирования. Метод Гомори
- •Глава III. Модели динамического программирования Динамическое программирование. Принцип оптимальности и функциональное уравнение Беллмана
- •Пример 2. Задача о замене оборудования.
- •Глава IV. Экономико-математические методы и модели теории игр Элементы теории игр в задачах оптимального управления экономическими процессами
- •Методы решения матричных игр в смешанных стратегиях
- •Редукция матричных игр к задачам линейного программирования
- •Глава V. Экономико-математические модели производственных процессов Производственные функции. Основные характеристики и типы производственных функций
- •Заключение
- •Библиографический список
Глава IV. Экономико-математические методы и модели теории игр Элементы теории игр в задачах оптимального управления экономическими процессами
Предмет теории игр. Основные понятия
В условиях рыночной экономики возникают ситуации, в которых сталкиваются интересы двух и более сторон. Такие ситуации относятся к конфликтным. Например, взаимоотношения между поставщиком и потребителем, покупателем и продавцом, банком и клиентом. Для конфликтных ситуаций оптимальность решений, принимаемых каждой из сторон, существенно зависит от действий другой стороны. При этом ни одна из сторон не может полностью контролировать положение, т. к. обеим сторонам приходится принимать решение в условиях неопределенности. Раздел математики, изучающий конфликтные ситуации на основе их математических моделей, называется теорией игр.
Отметим основные ее понятия:
игра – упрощенная математическая модель конфликтной ситуации, отличающаяся от реальной темы, что ведется по определенным правилам, при этом каждый из участников принимает такие решения, которые, как он полагает, обеспечат ему наилучший исход;
исход игры – значение некоторой функции, называемой функцией выигрыша ли платежной функцией, которая может задаваться либо аналитическим выражением, либо матрицей;
стратегия – совокупность правил, однозначно определяющих последовательность действий игрока в каждой конкретной ситуации. Величина выигрыша зависит от стратегии игрока. Всякая игра состоит из партий;
партией называют каждый вариант реализации игры. В партии игроки совершают конкретные ходы;
ход – выбор и реализация игроком одного из допустимых вариантов поведения.
Целью теории игр является определение оптимальной стратегии для каждого игрока.
Игры можно классифицировать по разным признакам:
по количеству стратегий игры делятся на конечные и бесконечные;
по взаимоотношению участников на бескоалиционные (без права заключения соглашения), некооперативные, и коалиционные (кооперативные);
по характеру выигрышей на игры с нулевой суммой (общий капитал игроков не меняется, а лишь перераспределяется в ходе игры, при этом сумма выигрышей равна 0, а проигрыш есть отрицательный выигрыш и с ненулевой суммой;
по виду платежной функции на матричные и непрерывные;
по количеству ходов игры на одноходовые и многоходовые (многоходовые игры подразделяются на стохастические и дифференциальные уравнения).
Ограничимся изучением парных матричных игр с нулевой суммой, а именно таких игр, в которых у каждого из двух игроков А и В конечное число возможных ходов – чистых стратегий.
Решение матричных игр в чистых стратегиях
Пусть
у игроков А
и В
соответственно m
и n
чистых стратегий, которые обозначим
через
и
.
Выбор
игроками любой пары стратегий
и
однозначно определяет исход игры,
описываемый числом
.
Матрица
называется платежной матрицей, где
– выигрыш игрока А
и проигрышь
игрока В.
Платежную матрицу удобно также представить в виде таблицы
Таблица 11.1
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В ее строках расположены чистые стратегии игрока А, а в столбцах – чистые стратегии игрока В.
Цель
матричной игры – выбор наиболее выгодных
стратегий, доставляющих игроку А
максимальный выигрыш, а игроку В
– минимальный проигрыш. Стратегию
игрока А
называют оптимальной, если при ее
применении выигрыш игрока А
не уменьшается при любой стратегии
игрока В.
Оптимальной для игрока В
называют стратегию, при которой проигрыш
игрока В не увеличивается при любой
стратегии игрока А.
При поиске оптимальных стратегий игроки
соблюдают принцип осторожности, согласно
которому противник является по меньшей
мере таким же разумным и не упустит ни
единой возможности использовать любую
ошибку соперника в своих интересах.
Пусть игрок А
выбрал некоторую стратегию
.
Сначала он найдет минимальное значение
ожидаемого выигрыша:
,
а затем из всех
выберет наибольшее
.
Число называют нижней ценой игры и является гарантированным выигрышем игрока А.
Очевидно,
находится в одной из строк матрицы H,
к примеру в строке
.
Тогда стратегию
называют максиминной, т. к.
.
В свою
очередь игрок В,
стремясь минимизировать проигрыш и
используя принцип осторожности, сначала
для каждой чистой стратегии
найдет максимально возможный проигрыш
–
,
а затем среди
выберет минимальное значение
.
Ему будет соответствовать чистая
стратегия
,
называемая минимаксной, т. к.
.
Число
называют верхней
ценой игры.
Оно показывает какой максимальный
проигрыш может быть у игрока В.
Таким образом, правильно используя
чистые стратегии, игрок А
обеспечит выигрыш не меньше ,
а игрок В
не позволит игроку А
выиграть больше чем .
Рассмотрим
примеры нахождения
и
.
Пример
1.
Пусть игра задана платежной матрицей
:
Выпишем
для каждой строки справа от матрицы
,
а снизу
каждого столбца. Тогда получим
Верхняя
и нижняя цены игры совпали:
.
Пример 2. Задана платежная матрица
Находим
и
Здесь
.
Справедлива следующая теорема.
Теорема
1.
В
любой матричной игре нижняя цена игры
не превосходит верхней цены игры, т. е.
.
Обозначим
через
и
номера чистых стратегий, при котором
.
Пару чистых стратегий
и
при этом называют седловой
точкой игры,
а
– седловым
элементом платежной матрицы.
Число
называют чистой
ценой игры.
Простота
решения игры с седловой точкой заключается
в том, что сразу найдены оптимальные
стратегии: максиминная
для игрока А
и минимаксная
для игрока В,
а цена игры – седловой элемент платежной
матрицы:
.
Отметим, что матричная игра может
содержать несколько седловых точек.
Максиминные и минимаксные стратегии
называют общим термином – минимаксными
стратегиями, а их выбор – принципом
минимакса.
Решение матричных игр в смешанных стратегиях
Рассмотрим
конечные матричные игры, в которых нет
седловой точки, т. е.
.
Нетрудно
доказать, что
.
Если игра одноходовая, то по принципу
минимакса игроку А
гарантирован выйгрыш
,
а игроку В
– проигрыш
.
Таким образом, для цены игры
справедливо соотношение
(11.1)
Если игра повторяется неоднократно, то постоянный выбор игроками минимаксных стратегий не логичен. Действительно, игрок В, зная что игрок А применяет лишь минимаксную стратегию , выберет иную стратегию – стратегию, соответствующую наименьшему элементу в строке платежной матрицы. Такие же рассуждения имеют место и для поведения игрока А. Следовательно, при неоднократном повторении игры игрокам необходимо менять стратегии. Выясним механизм выбора игроками оптимальных стратегий, а также что принять за стоимость игры.
Рассмотрим матричную игру, заданную таблицей (11.2).
Таблица 11.2
|
|
|
|||
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Через
и
обозначим соответственно вероятности
(относительные частоты), согласно которым
игроки А
и В
выбирают стратегии
и
.
Очевидно,
что
,
,
,
.
Упорядоченные множества
и
полностью определяет характер игры
игроков А
и В
и называются их смешанными
стратегиями.
Отметим, что любая их чистая стратегия
и
может быть описана как смешанная.
Действительно,
или
.
Пусть
игроки А
и В
применяют смешанные стратегии p
и q,
выбирают их случайно. Тогда вероятность
выбора комбинации
будет равна
.
Игра приобрела случайный характер. Следовательно, случайной становится и величина выигрыша.
Этой величиной является математическое ожидание выигрыша, которое определяется формулой:
Функцию
называют платежной
функцией игры
с заданной матрицей. Как и выше, введем
понятие нижней
и верхней
цены игры,
сохраняя при этом обозначения
и
:
,
.
Оптимальными
смешанными стратегиями
и
называют такие стратегии, при которых
.
Величину
называют ценой
игры v.
Теорема (Нейман): Любая конечная матричная игра имеет, по крайней мере, одно оптимальное решение, возможно, среди смешанных стратегий.
Для практических целей важны следующие свойства оптимальных смешанных стратегий, выражаемые следующими теоремами.
Сформулируем основную теорему теории игр.
Теорема
2.
Для того чтобы смешанные стратегии
и
были оптимальными, необходимо и достаточно
выполнение неравенств
(11.2)
(11.3)
Теорема 3. Пусть и – оптимальные смешанные стратегии и – цена игры.
Только
те вероятности
,
отличны от нуля, для которых
.
Только
те вероятности
,
отличны от нуля, для которых
.