Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Т5 Принятие решений в условиях неопределенности...doc
Скачиваний:
13
Добавлен:
28.09.2019
Размер:
915.46 Кб
Скачать

5.2. Теоретико-игровые модели

5.2.1. Оптимальность в форме равновесия

Теоретико-игро­вая модель (короче, игра) является моделью принятия решения в условиях конфликта. Этот конфликт обусловлен тем, что исход определяется совместными действиями нескольких сторон, пресле­дующих различные цели. Подчеркнем, что в свете сказанного выше стороны, оказывающие влияние на исход, не нужно понимать непременно как обладающие сознанием. Такая обстановка при принятии решения является настолько типичной, что практически любую достаточно сложную ситуацию принятия решения можно представить как теоретико-игровую; поэтому не случайно теоретико-игро­вые подходы занимают важнейшее место в современных исследованиях по принятию оптимальных решений.

В теоретико-игровых моделях принято стороны, принимающие решения, называть игроками, а выбираемые ими действия – стратегиями. Если число игроков равно двум и исходы оцениваются численно (каждый игрок дает свою оценку исходу), то получается так называемая биматричная игра; ее удобно задавать таблицей вида табл.5.3, в первый столбец которой выписаны страте­гии игрока 1, а в первую строку – стратегии игрока 2.

Таблица 5.3. Биматричная игра

y1

yj

ym

x1

(a11,b11)

(a1j,b1j)

(a1v,b1m)

xi

(ai1,bi1)

(aij,bij)

(aim,bim)

xn

(an1,bn1)

(anj,bnj)

(anm,bnm)

Каждый игрок независимо от другого производит выбор своей стратегии ('можно считать, например, что игроки производят выбор страте­гий одновременно). Если игрок 1 выбрал стратегию xi, а игрок 2 – стратегию yj; то получающийся при этом исход оценивается пер­вым игроком числом aij,, а вторым – числом bij; эти числа, называемые соответственно выигрышем игрока 1 и игрока 2, запи­саны в табл.5.3 на пересечении i-й строки и j-го столбца. Всякую пару стратегий (xi, yj) принято называть ситуацией в игре. Здесь мы будем вести анализ игр «на языке ситуа­ций».

П

Рис.5.1. Ситуация на дороге

ример 5-1 (два барана). Всем памятна печальная история, приключившаяся с двумя баранами, которые, сойдясь на узком мостике через речку, не сумели найти разумного решения и, столкнувшись лбами, оба свалились в воду. Сходная картина наблюдается подчас и в жизни в самых разнообразных вариантах; мы проанализируем ее применительно к уличному движению. Итак, к нерегулируемому перекрести; едут на высокой скорости под прямым углом друг к другу два автомобиля (рис.5.1). У каждого во­дителя есть две стратегии: 1) снизить скорость до безопасной (безопасная стратегия) и 2) ехать на высокой скорости (рискованная стратегия).

Ситуация, в которой оба водителя выбирают безопасные стратегии, приводит к благополучному исходу, оцениваемому для каждого водителя в 1; если оба водителя выбирают рискованную стратегию, то происходит столкновение, последствия которого оцениваются для каждого из них отрицательным числом —9. Если один из них уступит, снизив скорость, в то время как другой продолжает ехать на высокой скорости, то такой исход оценивается числом 0 для снизивше­го скорость (за «потерю престижа»), а для другого водителя – числом 3 (за «повы­шение престижа»). Получаем в итоге биматричную игру размерности 22, в ко­торой водители выступают в качестве игроков, Б и Р — безопасная и риско­ванная стратегии игроков (табл. 5.3).

Таблица 5.4. Биматричная игра

Б

Р

Б

(1,1)

(0,3)

Р

(3,0)

(-9,-9)

Проанализируем ситуации этой игры с точки зрения их устойчи­вости. Ситуация (Б, Б) являет­ся неустойчивой, так как в этой так как в этой ситуации игрок 1 может получить лучший для себя исход, изменив стратегию Б на стратегию Р. В этом случае он получит выигрыш 3 вместо 1. То же самое справедливо в ситуации (Б, Б) и для игрока 2. Точно так же неустойчивой является и ситуация (Р, Р). Итак, неустойчивость какой-либо ситуации проявляется в том, что в случае ее возникновения ей грозит распад, который обусловлен возможностями одного из игроков получить лучший для себя исход путем одностороннего изменения своей стратегии.

Ситуации (Б, Р) и (Р, Б), напротив, обе являются устойчивы­ми: если они возникли, то ни у одного из игроков нет оснований отходить от них, односторонне изменив свою стратегию. Устойчи­вость, например, ситуации (Б, Р) проявляется в «физическом» отношении в том, что каждый из водителей, узнав о стратегии другого, будет придерживаться выбранной им стратегии: первый будет продолжать ехать на низкой скорости, а второй – на высо­кой.

Описанные в примере устойчивые ситуации называются в тео­рии игр ситуациями равновесия (или равновесными в смысле Нэша — по имени американского математика Джона Нэша). В общем случае для биматричной игры, заданной в виде табл.5.3, равновесность ситуации означает, что для всех i=1,…n; j=1,…,m .

Равновесные ситуации можно рассматривать как оптимальные совместные решения, причем оптимальность равновесной ситуации проявляется в отношении ее устойчивости.

Возникает, однако, вопрос: а насколько хороши равновесные ситуации в других отношениях, прежде всего в отношении выигрышей игроков? Ведь каждый игрок может рассматривать выбор своей стратегии как принятие решения в условиях неопределенности (при этом другой игрок выступает в качестве среды) и может выбрать, например, свою максиминную стратегию, гарантирующую ему независимо от действий другого игрока максимин. Не получит ли он в таком случае больший выигрыш, чем в ситуации равнове­сия? Оказывается, что нет, и в этом очень легко убедиться.

Действительно, пусть – ситуация равновесия биматричной игры, представленной табл. 5.3, и – максиминная стратегия игрока 1. Тогда

откуда, используя определение ситуации равновесия, получаем

.

Аналогично получаем

.

Таким образом, в ситуации равновесия каждый из игроков име­ет выигрыш, не меньший, чем «свой» максимин.

Казалось бы, что все в порядке, но тут нас подстерегает довольно серьезная непри­ятность, состоящая в том, что компоненты ситуаций равновесия могут не составить снова ситуации равновесия. Вначале это утверждение кажется парадоксальным: если – ситуация равновесия, то ее компоненты ; составляя их, получаем ту же ситуацию . Но все дело в том, что ситуаций равнове­сия в игре может быть несколько. В рассмотренном выше примере «два барана» было две ситуации равновесия (Р, Б) и (Б, Р); взяв от первой ситуации первую компоненту, а от второй — вторую, получим не­равновесную ситуацию (Р, Р), приводящую к тому же к наихуд­шему для обоих игроков исходу (именно так поступили два бара­на, хотя неизвестно, руководствовались ли они концепцией равно­весия).

Указанное выше обстоятельство можно пояснить геометриче­ски следующим образом. Представим стратегии игрока 1 точками горизонтального отрезка, а стратегии игрока 2 – точками верти­кального отрезка (см. рис.5.2), тогда все ситуации представляются точками прямоугольника. Множество всех ситуаций равновесия игры образует некоторую область D внутри этого прямоугольника (которая может быть и пустой). Очевидно, что требование, чтобы всякая ситуация, составленная из компонент ситуаций равновесия, снова была ситуацией равновесия, означает с геометрической точки зрения, что область D имеет вид прямоугольника (рис. 5.2.б); такое множество ситуаций равновесия называется поэтому прямо­угольным (заметим, что множество, состоящее из единственной ситуации равновесия, является прямоугольным). Если же множест­во ситуаций равновесия не является прямоугольным, то выбор игроком 1 стратегии, являющейся первой компонентой некоторой ситуации равновесия, не гарантирует образования равновесной ситуации, даже если игрок 2 также выберет стратегию, являющую­ся второй компонентой некоторой ситуации равновесия (рис.5.2,а). Так как в общем случае множество ситуаций равновесия биматричной игры не является прямоугольным, то мож­но сделать вывод, что оптимальность в форме равновесия относит­ся именно к ситуациям, а не к их компонентам – стратегиям игро­ков.

Рис.5.2. Равновесные стратегии