- •Уфимский государственный нефтяной технический университет
- •А.П. Верёвкин, о.В. Кирюшин
- •Теория систем
- •Учебное пособие
- •1. Системы и задачи их анализа
- •1.1. Свойства систем
- •1.2. Количество информации
- •1.3. Классификация систем
- •2. Элементы теории множеств
- •2.1. Основные понятия и термины
- •2.2. Операции над множествами
- •2.3. Свойства операций над множествами
- •2.4. Алгебры
- •3. Элементы теории графов
- •4. Модели систем
- •4.1. Цели моделирования систем
- •4.2. Уровни моделирования
- •4.2.1. Классификация уровней моделирования
- •4.2.2. Задачи анализа свойств систем, решаемые на концептуальном уровне
- •4.2.3. Задачи, решаемые на топологическом уровне
- •I. Определение структурных свойств системы
- •II. Определение эквивалентных передач
- •III. Выделение подсистем в системе
- •4.2.4. Модели структурного уровня
- •4.2.5. Модели параметрического уровня
- •4.3. Классификация моделей систем
- •4.4. Модели систем типа Мс
- •4.5. Модели требований типа мт
- •5. Современная методология научных исследований и методы системного анализа
- •5.1. Основные понятия
- •5.2. Методология системного анализа
- •5.3. Общая схема принятия решений
- •5.4. Основные этапы приятия решений
- •5.5. Аналитические методы системного анализа
- •5.6. Математические методы
- •5.7. Семиотические методы
- •5.8. Группа экспертных методов
- •5.9. Игровые методы принятия решений
- •5.10. Имитационное моделирование
- •Список использованной литературы
5.9. Игровые методы принятия решений
Игровые методы принятия решений рассматривают вопросы принятия решений в условиях:
1) конфликтного взаимодействия элементов системы,
2) неопределенности,
3) сложности задачи принятия решений, вызванной многообъектностью системы.
Существует пять принципов конфликтного взаимодействия:
1) антагонизм,
2) бескоалиционное взаимодействие,
3) коалиционное взаимодействие,
4) кооперативное взаимодействие,
5) иерархическое взаимодействие с правом первого хода сверху.
Теория игр– математическая теория конфликтных ситуаций. Ее цель – дать инструмент для выработки разумного поведения участников конфликта.
Наиболее простой случай ситуаций, для которых имеется неопределенность – это случай конфликтных ситуаций, когда сталкиваются противоположные интересы двух или более групп. Выигрыш каждой стороны зависит от поведения соперника, а оно неизвестно.
Игра ведется по правилам, т.е. должны быть указаны права и обязанности участников. Игра может быть парнойимножественной.
Каждый участник делает ходы, которые могут быть личные и случайные. Некоторые игры (часто азартные) не являются предметом теории игр. Если ходы число случайные, то это предмет для теории вероятности.
Если существуют правила вида «если ситуация А, то я поступлю В», значит принята стратегияигры. В зависимости от числа стратегий могут бытьконечныеибесконечныеигры.
Оптимальной называется стратегия, которая обеспечивает максимальный выигрыш. Если есть случайные ходы, то говорят о максимизации выигрыша в среднем.
Игра называется игрой с нулевой суммой, если алгебраическая сумма выигрыша всех участников равна нулю. Самая простая игра с нулевой суммой называется антагонистической (игра со строгим соперником). Теория таких игр наиболее развита и строга.
Рассмотрим игру Gс игроками А и В. Будем считать, что «мы» - это А, а противник – В. Пусть у нас имеютсяmвозможных стратегий Аi, а у противника –nстратегийBj, то есть игра будет (mn).
Обозначим выигрыш А через aij, гдеi- стратегия А,j– стратегия В. Предполагается, что для всех пар стратегий Аiи Вjвыигрышaijизвестен (а значит, проигрыш В также известенaij= -bij). Представим информацию в виде таблицы 5.6.
Таблица 5.6
|
В1 |
В2 |
… |
Вn |
А1 |
a11 |
a12 |
… |
a1n |
А2 |
a21 |
a22 |
… |
a2n |
… |
… |
… |
… |
… |
Аm |
am1 |
am2 |
… |
amn |
Игра приведена к матричной форме. Обозначим эту матрицу как = {aij}.
Если цифры в строках одинаковые – стратегии называются дублирующими. Можно упростить матрицу, если в ней имеются дублирующие и доминирующие стратегии как по строкам, так и по столбцам путем отбрасывания таких стратегий.
Рассмотрим пример G(45) (см. табл. 5.7). Если мы выберем максимально выигрышную стратегию А3(до 10), то противник выберет В3и выигрыш будет всего 1. Отсюда типичный принцип игры: минимальный выигрыш должен быть максимальным (принципминимакса).
Добавим к табл. 5.7 столбец iи строкуj, в которые выпишем минимальные выигрыши для столбца и максимальные для строки.
Таблица 5.7
|
В1 |
В2 |
В3 |
В4 |
В5 |
i |
А1 |
3 |
4 |
5 |
2 |
3 |
2 |
А2 |
1 |
8 |
4 |
3 |
4 |
1 |
А3 |
10 |
3 |
1 |
7 |
6 |
1 |
А4 |
4 |
5 |
3 |
4 |
8 |
3 |
j |
10 |
8 |
5 |
7 |
8 |
|
Противник выбирает стратегию, где его проигрыш минимален. Таким образом, исходя из принципа осторожности мы будем выбирать А4, а противник В3.
Теперь предположим, что мы узнали о том, что противник выбрал В3, тогда мы выбираем А1и получаем выигрыш 5. Но если противник узнал, что у нас А1, он выберет В4и наш выигрыш будет 2. Мы и противник начали метаться. Это очень важно: минимаксные стратегии неустойчивы по отношению к информации о поведении другой стороны.
Иногда минимаксные стратегии дают устойчивое решение, когда =. В этом случае говорят, что совпадают верхняя и нижняя цена игры. Стратегии Аiи Вj, дающие на пересечении=, называютсячистыми, а квадрат матрицы, соответствующий таким стратегиям –седловой точкой матрицы.
Можно показать, что решение игры сводится к задаче линейного программирования:
LA=x1+x2+ … +xmmin
при ограничениях вида
a11.x1 + a21.x2 + … + am1.xm 1,
a12.x1 + a22.x2 + … + am2.xm 1,
a1n.x1 + a2n.x2 + … +amn.xm1
при выборе стратегии А*.
Выбор стратегии В аналогичен, но LB maxпри выборе стратегии В*.
Пара задач линейного программирования, по которой находится решение (А*, В*), называется двойственной. Показано, что минимум одной линейной функции соответствует максимуму другой.
Стабильно зависимое решение в зависимости от постановки задачи бывает:
1) скалярным Нэш-равновесием,
2) векторными равновесиями,
3) угрозы – контругрозы (УКУ),
4) векторно-оптимальное решение,
5) дележ по Шекли.
Для решения всех этих задач имеются соответствующие алгоритмы.