
- •Теория принятия решений
- •1. Элементы теории игр
- •1.1 Основные понятия
- •1.2 Матричные игры
- •1.3 Принцип минимакса. Седловые точки
- •1.4 Смешанные стратегии
- •1.5 Пример полного решения матричной игры
- •1.6 Задания по теории игр
- •2. Задача о назначениях
- •2.1 Содержательная постановка
- •2.2 Математическая модель
- •2.3 Венгерский метод для задачи о назначениях
- •2.4 Алгоритм венгерского метода
- •2.5 Пример решения задачи о назначениях венгерским методом
- •2.6 Задания по задаче о назначениях
- •3. Задача о коммивояжере
- •3.1 Постановка задачи
- •3.2 Математическая модель
- •3.3 Метод ветвей и границ
- •3.4 Метод ветвей и границ для решения задачи коммивояжера
- •3.5 Пример решения задачи коммивояжера
- •3.6 Задания по задаче о коммивояжере
- •4. Динамическое программирование
- •4.1 Построение модели дп
- •4.2 Построение вычислительной схемы дп
- •4.3 Несколько замечаний к методу дп
- •4.4 Задача о распределении ресурсов
- •4.5 Пример решения задачи о распределении ресурсов
- •4.6 Задания по задаче о распределении ресурсов
- •4.7 Задача о замене оборудования
- •4.8 Пример решения задачи о замене оборудования
- •4.9 Задания по задаче о замене оборудования
- •Библиографический список
- •1. Элементы теории игр 3
- •2. Задача о назначениях 14
- •3. Задача о коммивояжере 25
- •4. Динамическое программирование 35
1.4 Смешанные стратегии
Смешанной стратегией
(с.с.) игрока в матричной игре называется
вероятностное распределение на множестве
его ч.с. Таким образом, если i=1,…,m– чистые стратегии игрокаI,
аj=1,…,n– чистые стратегии игрокаII,
то с.с. игрокаI– это вероятностный вектор,
где
– вероятность выбора игрокомIчистой стратегииi,i=1,…,m.
Очевидно, что векторxдолжен удовлетворять условиям:
.
(1.1)
Аналогично с.с.
игрока II– это вероятностный вектор,
удовлетворяющий условиям
.
(1.2)
Обозначим множество
всех с.с. игрока IчерезX,
а игрокаII– черезY.
ЕслиIвыбрал с.с.,
аII–
,
то выигрышем игрокаI(соответственно, проигрышем игрокаII)
в ситуации (x,y)
естественно считать математическое
ожидание
.
(1.3)
В соответствии с принципом минимакса гарантированный, то есть наименьший выигрыш игрока Iпри выборе им с.с.xбудет
.
(1.4)
Поэтому игроку Iвыгодно выбратьxтак, чтобы максимально увеличитьu(x):
.
(1.5)
Аналогично гарантированный, то есть наибольший, проигрыш игрока IIпри выборе им с.с.yбудет
,
(1.6)
и игроку IIвыгодно минимизироватьv(y):
.
(1.7)
Числа u*,v*называются соответственно нижней и верхней ценой игры в смешанных стратегиях.
Замечание.Строго говоря, следовало бы доказать, что все минимумы и максимумы в (1.4)-(1.7) существуют. Однако это очевидно, так как в силу (1.1), (1.2) множестваX,Yкомпактны, а функции (1.3), (1.4) и (1.6) непрерывны.
Следующая лемма дает более простые, чем (1.4), (1.6) выражения величин u(x),v(y).
Лемма 1.1 [2] (о гарантированных выигрышах).
для всякой с.с.
;
для всякой с.с.
.
Матричная игра называется разрешимой в с.с., если u*=v*, а стратегииu*,v*, для которыхu(x*) =u*=v*=v(y*), называются оптимальными с.с. Пара (x*,y*) оптимальных с.с. образует ситуацию равновесия в с.с., а величинаu*=v*– цена игры в с.с. – равна ожидаемому среднему выигрышу игрокаI(и, соответственно, ожидаемому среднему проигрышу игрокаII ).
Как и в случае чистых стратегий, несложно показать, что всегда u*≤v*. Однако, заметим, что в случае смешанных стратегий строгое неравенствоu*<v*невозможно. Это вытекает из следующей основной теоремы матричных игр, доказанной Дж. фон Нейманом в 1928 г.
Теорема 1.2 [2] (о минимаксе). Для любой матричной игры имеет место равенствоu* =v*. Другими словами, любая матричная игра разрешима в с.с.
Оптимальные с.с. игроков, а также цена игры в с.с. могут быть найдены как решения пары двойственных задач линейного программирования:
,
Здесь
– элементы платежной матрицыA,
переменные
,
– компоненты смешанных стратегий
игроковI,IIсоответственно,u– гарантированный выигрыш игрокаI,v– гарантированный проигрыш игрокаIIв с.с.
1.5 Пример полного решения матричной игры
Задача. Решить игру с платежной матрицей
.
Решение.
1.Выясним, имеет ли игра решение в ч.с. Для этого вычислим нижнюю и верхнюю цены игры в ч.с.:
;
.
Получим, что a < b, следовательно, матрица A не имеет седловой точки, и игра не разрешима в ч.с.
2. Будем искать решение игры в с.с. Смешанная стратегия игрока I – это вероятностный вектор:
,
где
;
.
Аналогично смешанная стратегия игрока II – это вероятностный вектор:
,
где
;
.
3.
Заметим, что каждый элемент строки 1 не
меньше соответствующего элемента строки
3, то есть выигрыш игрока I
при выборе им ч.с. 1 не меньше его выигрыша
при выборе им ч.с. 3. Ясно, что разумный
игрок I
предпочтет стратегию 1 стратегии 3. В
этом случае говорят, что ч.с. 1 игрока I
доминирует над его ч.с. 3. Аналогично
каждый элемент столбца 2 не больше
соответствующего элемента
столбца 3, и
ч.с. 2 игрока II
доминирует над его ч.с. 3. Легко понять,
что в оптимальные с.с. доминируемые ч.с.
войдут с нулевыми вероятностями ,
.
Поэтому в дальнейшем мы можем рассматривать
сокращенную матрицу игры, полученную
из исходной вычеркиванием третьей
строки и третьего столбца:
.
4.
«Сдвиг» матрицы. Вместо матрицы
рассмотрим матрицу
,
полученную
из матрицы
добавлением одного и того же числа ко
всем ее элементам. Число это (в данном
случае 2) выбирается так, чтобы все
элементы матрицы
стали неотрицательными. Несложно
показать, что такой сдвиг платежной
матрицы не приводит к изменению
оптимальных смешанных стратегий игроков.
Изменяется только значение цены игры,
в данном случае оно увеличивается на
2.
Смысл
такого сдвига в следующем. В игре с
платежной матрицей
выигрыш игрока I
в любой ситуации неотрицателен, а значит,
неотрицательны и все его гарантированные
выигрыши, а также цена игры в с.с. Это
дает нам право, составляя пару двойственных
задач ЛП, считать переменные u,
v
неотрицательными.
5.
Составляем пару двойственных задач для
игры с платежной матрицей :
Прежде
чем решать их, удобно сделать замену
переменных ,
,
i=1,2.
Тогда задачи принимают вид
6.
Приводим вторую задачу к канонической
форме (вводя дополнительные переменные
),
и решаем ее симплекс-методом [1]
Первая итерация
|
|
|
|
|
|
f |
0 |
-1 |
-1 |
0 |
0 |
|
1 |
3 |
1 |
1 |
0 |
|
1 |
0 |
4 |
0 |
1 |
Вторая итерация
|
|
|
|
|
|
f |
1/3 |
0 |
-2/3 |
1/3 |
0 |
|
1/3 |
1 |
1/3 |
1/3 |
0 |
|
1 |
0 |
4 |
0 |
1 |
Третья итерация
|
|
|
|
|
|
f |
1/2 |
0 |
1 |
1/3 |
1/6 |
|
1/4 |
1 |
0 |
1/3 |
-1/12 |
|
1/4 |
0 |
1 |
0 |
1/4 |
Оптимальное
решение ,
.
Используя вторую теорему двойственности,
находим оптимальное решение двойственной
задачи:
,
.
Возвращаясь к исходным переменным и
вспоминая, что
,
,
получаем оптимальные с.с. игроков:
,
.
Цена игры в с.с. равна 0 (с учетом сдвига
матрицы).
Комментарий.
Оптимальные с.с. игроков диктуют им
следующие действия при многократном
повторении игры: игроку I
следует выбирать свою первую ч.с. с
вероятностью
,
а вторую – с вероятностью
.
ИгрокуII
– выбирать как первую, так и вторую ч.с.
с вероятностью
.
При этом ожидаемый средний выигрыш
игрокаI
(и проигрыш игрока II)
будет равен нулю – ничья.