- •1. Системы и задачи их анализа
- •1.1. Свойства систем
- •1.2. Количество информации
- •1.3. Классификация систем
- •2. Элементы теории множеств
- •2.1. Основные понятия и термины
- •2.2. Операции над множествами
- •2.3. Свойства операций над множествами
- •2.4. Алгебры
- •3. Элементы теории графов
- •4. Модели систем
- •4.1. Цели моделирования систем
- •4.2. Уровни моделирования
- •4.2.1. Классификация уровней моделирования
- •4.2.2. Задачи анализа свойств систем, решаемые на концептуальном уровне
- •4.2.3. Задачи, решаемые на топологическом уровне
- •I. Определение структурных свойств системы
- •II. Определение эквивалентных передач
- •III. Выделение подсистем в системе
- •4.2.4. Модели структурного уровня
- •4.2.5. Модели параметрического уровня
- •4.3. Классификация моделей систем
- •4.4. Модели систем типа Мс
- •4.5. Модели требований типа мт
- •5. Современная методология научных исследований и методы системного анализа
- •5.1. Основные понятия
- •5.2. Методология системного анализа
- •5.3. Общая схема принятия решений
- •5.4. Основные этапы приятия решений
- •5.5. Аналитические методы системного анализа
- •5.6. Математические методы
- •5.7. Семиотические методы
- •5.8. Группа экспертных методов
- •5.9. Игровые методы принятия решений
- •5.10. Имитационное моделирование
- •Список использованной литературы
5.9. Игровые методы принятия решений
Игровые методы принятия решений рассматривают вопросы принятия решений в условиях:
1) конфликтного взаимодействия элементов системы,
2) неопределенности,
3) сложности задачи принятия решений, вызванной многообъектностью системы.
Существует пять принципов конфликтного взаимодействия:
1) антагонизм,
2) бескоалиционное взаимодействие,
3) коалиционное взаимодействие,
4) кооперативное взаимодействие,
5) иерархическое взаимодействие с правом первого хода сверху.
Теория игр – математическая теория конфликтных ситуаций. Ее цель – дать инструмент для выработки разумного поведения участников конфликта.
Наиболее простой случай ситуаций, для которых имеется неопределенность – это случай конфликтных ситуаций, когда сталкиваются противоположные интересы двух или более групп. Выигрыш каждой стороны зависит от поведения соперника, а оно неизвестно.
Игра ведется по правилам, т.е. должны быть указаны права и обязанности участников. Игра может быть парной и множественной.
Каждый участник делает ходы, которые могут быть личные и случайные. Некоторые игры (часто азартные) не являются предметом теории игр. Если ходы число случайные, то это предмет для теории вероятности.
Если существуют правила вида «если ситуация А, то я поступлю В», значит принята стратегия игры. В зависимости от числа стратегий могут быть конечные и бесконечные игры.
Оптимальной называется стратегия, которая обеспечивает максимальный выигрыш. Если есть случайные ходы, то говорят о максимизации выигрыша в среднем.
Игра называется игрой с нулевой суммой, если алгебраическая сумма выигрыша всех участников равна нулю. Самая простая игра с нулевой суммой называется антагонистической (игра со строгим соперником). Теория таких игр наиболее развита и строга.
Рассмотрим игру G с игроками А и В. Будем считать, что «мы» - это А, а противник – В. Пусть у нас имеются m возможных стратегий Аi, а у противника – n стратегий Bj, то есть игра будет (mn).
Обозначим выигрыш А через aij, где i - стратегия А, j – стратегия В. Предполагается, что для всех пар стратегий Аi и Вj выигрыш aij известен (а значит, проигрыш В также известен aij = - bij). Представим информацию в виде таблицы 5.6.
Таблица 5.6
|
В1 |
В2 |
… |
Вn |
А1 |
a11 |
a12 |
… |
a1n |
А2 |
a21 |
a22 |
… |
a2n |
… |
… |
… |
… |
… |
Аm |
am1 |
am2 |
… |
amn |
Игра приведена к матричной форме. Обозначим эту матрицу как = {aij}.
Если цифры в строках одинаковые – стратегии называются дублирующими. Можно упростить матрицу, если в ней имеются дублирующие и доминирующие стратегии как по строкам, так и по столбцам путем отбрасывания таких стратегий.
Рассмотрим пример G(45) (см. табл. 5.7). Если мы выберем максимально выигрышную стратегию А3 (до 10), то противник выберет В3 и выигрыш будет всего 1. Отсюда типичный принцип игры: минимальный выигрыш должен быть максимальным (принцип минимакса).
Добавим к табл. 5.7 столбец i и строку j, в которые выпишем минимальные выигрыши для столбца и максимальные для строки.
Таблица 5.7
|
В1 |
В2 |
В3 |
В4 |
В5 |
i |
А1 |
3 |
4 |
5 |
2 |
3 |
2 |
А2 |
1 |
8 |
4 |
3 |
4 |
1 |
А3 |
10 |
3 |
1 |
7 |
6 |
1 |
А4 |
4 |
5 |
3 |
4 |
8 |
3 |
j |
10 |
8 |
5 |
7 |
8 |
|
Противник выбирает стратегию, где его проигрыш минимален. Таким образом, исходя из принципа осторожности мы будем выбирать А4, а противник В3.
Теперь предположим, что мы узнали о том, что противник выбрал В3, тогда мы выбираем А1 и получаем выигрыш 5. Но если противник узнал, что у нас А1, он выберет В4 и наш выигрыш будет 2. Мы и противник начали метаться. Это очень важно: минимаксные стратегии неустойчивы по отношению к информации о поведении другой стороны.
Иногда минимаксные стратегии дают устойчивое решение, когда = . В этом случае говорят, что совпадают верхняя и нижняя цена игры. Стратегии Аi и Вj, дающие на пересечении = , называются чистыми, а квадрат матрицы, соответствующий таким стратегиям – седловой точкой матрицы.
Можно показать, что решение игры сводится к задаче линейного программирования:
LA = x1 + x2 + … + xm min
при ограничениях вида
a11.x1 + a21.x2 + … + am1.xm 1,
a12.x1 + a22.x2 + … + am2.xm 1,
a1n.x1 + a2n.x2 + … + amn.xm 1
при выборе стратегии А*.
Выбор стратегии В аналогичен, но LB max при выборе стратегии В*.
Пара задач линейного программирования, по которой находится решение (А*, В*), называется двойственной. Показано, что минимум одной линейной функции соответствует максимуму другой.
Стабильно зависимое решение в зависимости от постановки задачи бывает:
1) скалярным Нэш-равновесием,
2) векторными равновесиями,
3) угрозы – контругрозы (УКУ),
4) векторно-оптимальное решение,
5) дележ по Шекли.
Для решения всех этих задач имеются соответствующие алгоритмы.
