
- •Министерство образования и науки российской федерации
- •Часть 1 лекция 1 основные понятия теории статистических решений
- •1.1. Основные определения
- •1.2. Основные формулы
- •Лекция 2 стратегии принятия решений
- •2.1. Критерии и принципы принятия решений
- •Лекция 3 проверка гипотез
- •3.1. Проверка простой гипотезы против простой альтернативы
- •3.2. Многоальтернативная задача выбора решения
- •Часть 2 лекция 1 основные понятия исследования операций
- •1.1. Основные определения
- •Лекция 2 основные понятия теории игр Матричная игра
- •2.1. Основные определения
- •2.2. Матричная игра
- •Лекция 3 Матричная игра (продолжение)
- •3.1. Пример решения матричной игры в чистых стратегиях.
- •3.2. Пример решения матричной игры с седловой точкой.
- •Лекция 4 смешанное расширение Матричной игры
- •4.1. Смешанные стратегии
- •4.2. Основная теорема матричных игр
- •Лекция 5 методы решения Матричных игр в смешанных стратегиях
- •5.1. Решение матричной игры
- •Лекция 6 методы решения Матричных игр в смешанных стратегиях (продолжение)
- •6.1. Применение линейного программирования
- •Лекция 7 итерационный метод решения Матричной игры
- •7.1. Метод Брауна-Робинсона
- •Лекция 8 итерационный метод решения Матричной игры (продолжение)
- •8.1. Пример решения игрыметодом Брауна-Робинсона
- •8.2. Метод решения бесконечных игр
- •Лекция 9 неантагонистические игры двух игроков
- •9.1. Биматричная игра
- •9.2. Смешанное расширение биматричной игры
- •Лекция 10 неантагонистические игры n игроков
- •10.1. Бескоалиционная игра n игроков
- •10.2. Кооперативная игра n игроков
- •Лекция 11 неантагонистические игры n игроков (продолжение)
- •11.1. Пример решения кооперативной игры
- •Лекция 12 вектор шепли
- •12.1. Вектор и аксиомы Шепли
- •Лекция 13 вектор шепли (продолжение)
- •13.1. Пример расчета вектора Шепли
- •13.2. Понятие о дифференциальных играх
- •Содержание
- •Часть 1
- •Часть 2
Лекция 12 вектор шепли
12.1. Вектор и аксиомы Шепли
Носителем
игры называется такая коалицияS,
чтодля любой коалиции
(любой игрок, не принадлежащий носителю,
является «болваном» и не может ничего
внести ни в одну коалицию).
Обозначим
((N,u))
игруnигроков с
характеристической функциейu,P—произвольную
перестановку множества игроковN={1,2,…,n},
аπ—соответствующую ей подстановку,
в которой дляi=1,2,…,n
()
значение
представляет собой элемент множестваN, в который переходит
элемент iв
перестановкеP. Тогда
обозначим ((N,πu))
такую игруnигроков
((N,w)),
что для любой коалиции
,S={i1,i2,…,is}
(12.1.1)
Игра ((N,πu)) отличается от игры ((N,u)) только тем, что в ней игроки поменялись ролями в соответствии с перестановкойP.
Поставим в соответствие каждой кооперативной игре ((N,u))nигроков вектор (вектор значений или вектор Шепли игры)φ(u)=[φ1(u),φ2(u),…, φn(u)]T, компоненты которого будем интерпретировать как выигрыши, полученные игроками в результате соглашения или решения арбитра. При этом рассматриваемое соответствие удовлетворяет следующимаксиомам Шепли:
1. Если коалицияS—любой носитель игры ((N,u)), то
(12.1.2)
2. Для любой подстановки π справедливо
(12.1.3)
3. Если ((N,u)) и ((N,w))—две любые кооперативные игры, то
(12.1.4)
Можно доказать, что этих аксиом достаточно, чтобы определить вектор единственным образом.
Рассмотрим
простую игруn
игроков ((N,Su))
с характеристической функцией, которая
для любой коалицииsигрокови заданной коалиции
определяется следующим образом
(12.1.5)
Тогда аксиомы 1, 2 однозначно определяют для этой игры вектор Шепли
(12.1.6)
Действительно,
SиT—носители
игры. Тогда по аксиоме 1, если,
то
(12.1.7)
Отсюда следует,
что
При этом в соответствии с аксиомой 2
Наконец, поскольку в коалицииS
именно sигроков,
то в соответствии с аксиомой 1 сумма
компонент вектораШеплиравна 1.
Можно показать, что любая игра может быть единственным образом представлена в виде линейной комбинации простых игр ((N,Su)), поэтому характеристическая функция и вектор Шепли (оптимальный дележ) любой игры выражаются в виде линейных комбинаций соответствующих простейших характеристических функций и векторов.
Если ((N,u))—любая играnигроков, то можно найти 2n–1 вещественных чиселSc, таких, что
(12.1.8)
где суммирование идет по всем подмножествам Sмножества Nкроме пустого множества. При этом, считая, что число элементов (игроков) в подмножествеTравно t, можно определить
(12.1.9)
(12.1.10)
Лекция 13 вектор шепли (продолжение)
13.1. Пример расчета вектора Шепли
В примере 11.1 («джаз-оркестр») N={1,2,3},u(1,2,3)=10 000, u(1,2)=8 000, u(2,3)=6 500, u(2)=3 000, u(1,3)=5 000, u(1)=2 000, u(3)=0. Определим вектор Шепли игры (оптимальный дележ)φ=[φ1,φ2,φ3]T.
Обозначим S1={1}, S2={2}, S3={3}, S12={1,2}, S13={1,3}, S23={2,3}, S123={1,2,3}.
13.2. Понятие о дифференциальных играх
Рассмотрим два объекта управления (игроки 1и2), которые описываются двумя системами обыкновенных дифференциальных уравнений
(13.2.1)
(13.2.2)
Игрок 1(2) начинает движение из состояния1x(t0) (2x(t0)) и перемещается вn–мерном пространстве состояний, выбирая в каждый момент времени значение1m(2m)–мерного вектора управления1u(t) [2u(t)] в соответствии со своими целями и информацией, которая ему доступна в этот момент времени.
Цели
игроков в дифференциальной игре
определяются с помощью функций выигрыша
(проигрыша), которые зависят от траекторий
движения игроков 1x(t)
и2x(t).
Если, например, антагонистическая
дифференциальная игра описывает процесс
преследования игроком2игрока1, то расстояние между игрокамипредставляет собой выигрыш игрока1
и проигрыш игрока2. При
этом игроки в каждый момент времени
могут иметь полную, точную или искаженную
информацию о своем состоянии и состоянии
противника. Если, например, один из
игроков в каждый момент времени имеет
информацию также и об управлении, которое
выбирает противник, то такая игра
называется игройс дискриминацией
противника.