
- •Основы оптимизации процесса управления Критерий качества управления
- •1.1. Математическое описание объекта управления и внешней среды
- •2. Одношаговые задачи управления
- •2.1. Линейное программирование
- •Решение задачи линейного программирования симплекс-методом
- •2.2. Двойственная задача линейного программирования
- •3. Многошаговые процессы управления
- •2. Задача распределения средств между предприятиями
- •3.1. Поиск оптимальной последовательности (цепочки) управлений методом динамического программирования
- •Управление конечным состоянием
- •Методика построения и решения задачи средствами динамического программирования
- •Примеры построения и решения многошаговых задач средствами динамического программирования
- •Построение модели
- •Решение задачи
- •4. Игровые задачи управления
- •4.1. Основы игровых задач
- •Понятие стратегии
- •Верхняя и нижняя цены игры
- •Цены и оптимальные стратегии игр
- •Чистые и смешанные стратегии
- •Верхняя и нижняя цены игры при смешанных стратегиях
- •Нахождение оптимальных стратегий
- •Примеры составления и решения чистых игровых задач
- •Пример решения смешанной игры
- •4.2. Кооперативные игры
- •Методика поиска оптимального дележа
- •Пример кооперативной игры
- •Литература
4. Игровые задачи управления
4.1. Основы игровых задач
Математической основой игровых задач является теория игр, которая представляет собой дисциплину с предметом исследования принятия решения в так называемых конфликтных ситуациях. Ситуация называется конфликтной, если в ней сталкиваются интересы нескольких (обычно двух) сторон, преследующих противоположные цели. Каждая из сторон может проводить ряд мероприятий для достижения своих целей, причем успех одной стороны означает неудачу другой.
Конфликтные ситуации часто возникают в экономике, когда при наличии свободной конкуренции в роли борющихся сторон выступают торговые фирмы, промышленные предприятия и т. п. К конфликтным ситуациям относятся почти все ситуации, возникающие при планировании военных операций, выборе системы оружия, охране объектов от нападения, преследовании и перехвате цели и т. п., спортивные состязания, арбитражные споры, аукционы, выборы в парламент при наличии нескольких кандидатов на одно место.
Для того чтобы сделать возможным математический анализ конфликтной ситуации, ее необходимо упростить, учтя только основные факторы. Упрощенная формализованная модель конфликтной ситуации называется игрой, а конфликтующие стороны— игроками.
Рассмотрим игры, в которых имеется только две конфликтующие стороны. Игра представляет собой совокупность правил, описывающих поведение игроков.
Понятие стратегии
Представим себе, что мы хотим сыграть шахматную партию белыми, но лично присутствовать при игре не можем. У нас есть заместитель, который должен провести партию и выполнять все наши указания. Но сам он не способен принимать самостоятельные решения. Чтобы заместитель мог провести всю партию до конца, ему должны быть даны такие указания, которые предусматривали бы любые возможные положения на доске и для каждого положения определяли бы тот ход, который должен быть сделан. Полная система таких указаний и представляет собой стратегию.
Так, стратегия белых должна указывать первый ход, затем для каждого возможного ответа черных следующий ход белых и т. д. Конечно, составление полной стратегии при игре в шахматы является огромной, практически невыполнимой работой. Например, игрок белыми, присутствующий лично, должен принять два решения, чтобы сделать два первых хода. Играя же через заместителя, он должен подготовить 21 решение для тех же двух ходов (одно решение — первый ход и 20 решений — ответы на 20 возможных первых ходов черных). Тем не менее, во многих более простых задачах понятие стратегии является весьма полезным.
Таким образом, стратегия игрока представляет собой однозначное описание его выбора в каждой возможной ситуации, при которой он должен сделать личный ход.
Если игра состоит только из личных ходов, то исход игры определен, если каждый из игроков выбрал свою стратегию. Однако, если в игре имеются случайные ходы, то игра будет носить вероятностный характер и выбор стратегий игроков еще не определит окончательно исход игры.
Обозначим
через X
и
У множество или пространство
всевозможных стратегий, которыми могут
пользоваться участники игры, называемые
далее первым и вторым игроками
соответственно. Величины
и
будут
означать конкретные стратегии первого
и второго игроков.
Для
того чтобы ввести в рассмотрение
случайные ходы, удобно считать, что в
игре принимает участие условно третий
игрок, который и делает случайные ходы,
пользуясь для этого соответствующим
механизмом случайного выбора.
Обозначим через H
пространство стратегий этого игрока.
Любая стратегия
третьего игрока, представляющая собой
конкретную последовательность всех
случайных ходов в партии, будет происходить
с некоторой вероятностью p(h),
которую
легко подсчитать, зная вероятности
каждого случайного хода в этой
последовательности. Легко видеть,
что p(h)
представляет
собой распределение вероятностей
на пространстве H,
т. е. удовлетворяет условиям
Обозначим через g некоторый вариант игры, т. е. одну возможную партию. Этот вариант будет определен, если выбраны стратегии игроков х и у и стратегии случайных ходов h. Следовательно, конкретная партия g представляет собой тройку величин х, у и h:
Результатом партии является выигрыш или проигрыш каждого из игроков. Для удобства выигрыши и проигрыши будем оценивать каким-либо числом, например суммой денег в рублях.
Рассмотрим одну из конкретных партий g(x, y, h) и обозначим через Lx(x, у, h) и Lу(х, у, h) проигрыши или потери первого и второго игроков соответственно. При этом выигрыши рассматриваем как отрицательные проигрыши. Общая сумма проигрышей обоих игроков равна:
В дальнейшем ограничимся рассмотрением только так называемых игр с нулевой суммой. В таких играх проигрыш одного игрока равен выигрышу другого игрока.
При рассмотрении игр с нулевой суммой нет необходимости отдельно учитывать проигрыши или выигрыши обоих игроков, а можно ограничиться рассмотрением только проигрыша второго игрока (выигрыша первого игрока):
Поскольку стратегия h является случайной, то при выбранных стратегиях х и у потери L(x, у, h) будет случайной величиной с распределением вероятностей p(h) на пространстве Н. Поэтому оценить выбранные стратегии х и у можно лишь путем усреднения потерь L(x, у, h) по всему пространству H, т. е. введя понятие средних потерь L(x, у), определяемых из соотношения
Игра будет определена, если перечислены все возможные стратегии игроков, т. е. заданы пространства X , и Y, и для любых и определены потери L(x,у). Игра G определяется тройкой
где X и Y представляет собой некоторые пространства, a L — ограниченная числовая функция. Точки и называются стратегиями первого и второго игроков, а функция L называется функцией потерь.
Игры, в которых каждый игрок имеет конечное число стратегий (конечные игры), удобно задавать в виде так называемой матрицы потерь. Пусть G=(X, Y, L)—конечная игра, в которой Х={х1 ..., xm} и Y={у1 ..., уm}. Тогда матрица порядка mп
в которой qij = L(xi,yj) называется матрицей игры G.
Для того чтобы описание игры было законченным, необходимо указать цели, которыми руководствуются игроки при выборе своих стратегий. Эти цели достаточно просты. Первый игрок стремится обеспечить себе наибольший выигрыш, т. е. максимизировать функцию L(x, у), а второй игрок стремится сделать свой проигрыш наименьшим, т.е. минимизировать функцию L(x, у). Специфической трудностью при этом является то, что ни один из игроков не контролирует полностью значение L(x, у), так как первый игрок распоряжается только значением х, а второй — только значением у.