![](/user_photo/2706_HbeT2.jpg)
- •Тема 5. Принятие решений в условиях неопределенности
- •Тема 5. Принятие решений в условиях неопределенности 1
- •5.1.Критерии в условиях неопределенности
- •5.1.1.Критерий Лапласа
- •5.1.2. Минимаксный критерий
- •5.1.3.Критерий Сэвиджа
- •5.1.4. Критерий Гурвица
- •5.1.5. Пример.
- •5.2. Теоретико-игровые модели
- •5.2.1. Оптимальность в форме равновесия
- •5.2.2. Почти антагонистические игры
- •5.2.3. Принципы оптимальности в условиях обмена информацией
- •5.2.4.Смешанные стратегии
- •5.3. Игры с нулевой суммой
- •5.3.1. Оптимальное решение игры двух лиц с нулевой суммой
- •5.3.2. Теорема о минимаксе
- •5.3.3. Решение игр с нулевой суммой в смешанных стратегиях
- •5.4. Методы решения матричных игр в смешанных стратегиях
- •5.4.1. Графическое решение игр
- •5.4.2. Метод последовательных приближений
- •5.4.3. Решение матричных игр методами линейного программирования
5.2. Теоретико-игровые модели
5.2.1. Оптимальность в форме равновесия
Теоретико-игровая модель (короче, игра) является моделью принятия решения в условиях конфликта. Этот конфликт обусловлен тем, что исход определяется совместными действиями нескольких сторон, преследующих различные цели. Подчеркнем, что в свете сказанного выше стороны, оказывающие влияние на исход, не нужно понимать непременно как обладающие сознанием. Такая обстановка при принятии решения является настолько типичной, что практически любую достаточно сложную ситуацию принятия решения можно представить как теоретико-игровую; поэтому не случайно теоретико-игровые подходы занимают важнейшее место в современных исследованиях по принятию оптимальных решений.
В теоретико-игровых моделях принято стороны, принимающие решения, называть игроками, а выбираемые ими действия – стратегиями. Если число игроков равно двум и исходы оцениваются численно (каждый игрок дает свою оценку исходу), то получается так называемая биматричная игра; ее удобно задавать таблицей вида табл.5.3, в первый столбец которой выписаны стратегии игрока 1, а в первую строку – стратегии игрока 2.
Таблица 5.3. Биматричная игра
|
y1 |
… |
yj |
… |
ym |
x1 |
(a11,b11) |
… |
(a1j,b1j) |
… |
(a1v,b1m) |
… |
… |
|
… |
|
… |
xi |
(ai1,bi1) |
|
(aij,bij) |
|
(aim,bim) |
… |
… |
|
… |
|
… |
xn |
(an1,bn1) |
|
(anj,bnj) |
|
(anm,bnm) |
Каждый игрок независимо от другого производит выбор своей стратегии ('можно считать, например, что игроки производят выбор стратегий одновременно). Если игрок 1 выбрал стратегию xi, а игрок 2 – стратегию yj; то получающийся при этом исход оценивается первым игроком числом aij,, а вторым – числом bij; эти числа, называемые соответственно выигрышем игрока 1 и игрока 2, записаны в табл.5.3 на пересечении i-й строки и j-го столбца. Всякую пару стратегий (xi, yj) принято называть ситуацией в игре. Здесь мы будем вести анализ игр «на языке ситуаций».
П
Рис.5.1. Ситуация
на дороге
движению.
Итак, к нерегулируемому перекрести;
едут на высокой скорости под прямым
углом друг к другу два автомобиля
(рис.5.1). У каждого водителя есть две
стратегии: 1) снизить скорость до
безопасной (безопасная стратегия) и 2)
ехать на высокой скорости (рискованная
стратегия).
Ситуация, в которой оба водителя выбирают безопасные стратегии, приводит к благополучному исходу, оцениваемому для каждого водителя в 1; если оба водителя выбирают рискованную стратегию, то происходит столкновение, последствия которого оцениваются для каждого из них отрицательным числом —9. Если один из них уступит, снизив скорость, в то время как другой продолжает ехать на высокой скорости, то такой исход оценивается числом 0 для снизившего скорость (за «потерю престижа»), а для другого водителя – числом 3 (за «повышение престижа»). Получаем в итоге биматричную игру размерности 22, в которой водители выступают в качестве игроков, Б и Р — безопасная и рискованная стратегии игроков (табл. 5.3).
Таблица 5.4. Биматричная игра
|
Б |
Р |
Б |
(1,1) |
(0,3) |
Р |
(3,0) |
(-9,-9) |
Проанализируем ситуации этой игры с точки зрения их устойчивости. Ситуация (Б, Б) является неустойчивой, так как в этой так как в этой ситуации игрок 1 может получить лучший для себя исход, изменив стратегию Б на стратегию Р. В этом случае он получит выигрыш 3 вместо 1. То же самое справедливо в ситуации (Б, Б) и для игрока 2. Точно так же неустойчивой является и ситуация (Р, Р). Итак, неустойчивость какой-либо ситуации проявляется в том, что в случае ее возникновения ей грозит распад, который обусловлен возможностями одного из игроков получить лучший для себя исход путем одностороннего изменения своей стратегии.
Ситуации (Б, Р) и (Р, Б), напротив, обе являются устойчивыми: если они возникли, то ни у одного из игроков нет оснований отходить от них, односторонне изменив свою стратегию. Устойчивость, например, ситуации (Б, Р) проявляется в «физическом» отношении в том, что каждый из водителей, узнав о стратегии другого, будет придерживаться выбранной им стратегии: первый будет продолжать ехать на низкой скорости, а второй – на высокой.
Описанные в примере устойчивые ситуации
называются в теории игр ситуациями
равновесия (или равновесными в смысле
Нэша — по имени американского математика
Джона Нэша). В общем случае для биматричной
игры, заданной в виде
табл.5.3,
равновесность ситуации
означает, что для всех i=1,…n;
j=1,…,m
.
Равновесные ситуации можно рассматривать как оптимальные совместные решения, причем оптимальность равновесной ситуации проявляется в отношении ее устойчивости.
Возникает, однако, вопрос: а насколько хороши равновесные ситуации в других отношениях, прежде всего в отношении выигрышей игроков? Ведь каждый игрок может рассматривать выбор своей стратегии как принятие решения в условиях неопределенности (при этом другой игрок выступает в качестве среды) и может выбрать, например, свою максиминную стратегию, гарантирующую ему независимо от действий другого игрока максимин. Не получит ли он в таком случае больший выигрыш, чем в ситуации равновесия? Оказывается, что нет, и в этом очень легко убедиться.
Действительно, пусть
– ситуация равновесия биматричной
игры, представленной табл. 5.3, и
– максиминная стратегия игрока 1. Тогда
откуда, используя определение ситуации равновесия, получаем
.
Аналогично получаем
.
Таким образом, в ситуации равновесия каждый из игроков имеет выигрыш, не меньший, чем «свой» максимин.
Казалось бы, что все в порядке, но тут
нас подстерегает довольно серьезная
неприятность, состоящая в том, что
компоненты ситуаций равновесия могут
не составить снова ситуации равновесия.
Вначале это утверждение кажется
парадоксальным: если
– ситуация равновесия, то ее компоненты
;
составляя их, получаем ту же ситуацию
.
Но все дело в том, что ситуаций равновесия
в игре может быть несколько. В рассмотренном
выше примере «два барана» было две
ситуации равновесия (Р, Б) и (Б, Р); взяв
от первой ситуации первую компоненту,
а от второй — вторую, получим неравновесную
ситуацию (Р, Р), приводящую к тому же к
наихудшему для обоих игроков исходу
(именно так поступили два барана,
хотя неизвестно, руководствовались ли
они концепцией равновесия).
Указанное выше обстоятельство можно пояснить геометрически следующим образом. Представим стратегии игрока 1 точками горизонтального отрезка, а стратегии игрока 2 – точками вертикального отрезка (см. рис.5.2), тогда все ситуации представляются точками прямоугольника. Множество всех ситуаций равновесия игры образует некоторую область D внутри этого прямоугольника (которая может быть и пустой). Очевидно, что требование, чтобы всякая ситуация, составленная из компонент ситуаций равновесия, снова была ситуацией равновесия, означает с геометрической точки зрения, что область D имеет вид прямоугольника (рис. 5.2.б); такое множество ситуаций равновесия называется поэтому прямоугольным (заметим, что множество, состоящее из единственной ситуации равновесия, является прямоугольным). Если же множество ситуаций равновесия не является прямоугольным, то выбор игроком 1 стратегии, являющейся первой компонентой некоторой ситуации равновесия, не гарантирует образования равновесной ситуации, даже если игрок 2 также выберет стратегию, являющуюся второй компонентой некоторой ситуации равновесия (рис.5.2,а). Так как в общем случае множество ситуаций равновесия биматричной игры не является прямоугольным, то можно сделать вывод, что оптимальность в форме равновесия относится именно к ситуациям, а не к их компонентам – стратегиям игроков.
Рис.5.2.
Равновесные стратегии