Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

TI_v_EMM_2014

.pdf
Скачиваний:
11
Добавлен:
27.05.2015
Размер:
3.52 Mб
Скачать

=

(13)

Равновесные заявки зависят от типов {r1} игроков. Если в дальнейшем исследователь получит точную информацию о типах игроков, то, подставив значения типов игроков в (13), сможет получить точное равновесие Нэша этой игры.

Однако полученный результат можно использовать и другим способом. Пусть исследователю известна та же информация, что и центру. Пусть игра разыграна один раз, и центр получил от игроков заявки (s1,s2). Тогда, зная (13), центр может узнать типы игроков. Так, например, если обе заявки меньше 1, центр может определить типы игроков по формуле:

r1 = 0.75 s1 0.25 s2, r2 = 0.75 s2 0.25 s1.

Если обе заявки равны 1, центр может сделать вывод, что типы обоих игроков превышают 0.5. Аналогично можно восстановить типы и для случаев, когда лишь одна из заявок равна 1. Таким образом, по результатам игры центр (а, значит, и исследователь) может с той или иной точностью восстановить типы игроков.

.

Иерархические игры.

Борьба за лидерство.

Определение . Исход x R игры называется индивидуально рациональным, если

sup

 

inf u

y , y

i

u

xR для всех i N . (1)

 

 

 

i

i i

 

 

i

 

 

 

 

 

yi X i yˆ X ˆ

 

 

 

 

 

 

 

 

 

 

 

i

 

i

 

 

 

 

 

 

 

 

 

 

 

Лемма . Все NE-исходы индивидуально рациональны.

 

 

 

Доказательство. Для всех i справедливы неравенства

 

 

xH .

y

i

X

i

inf u

y , y

ˆ

u

y , xH u

 

 

i

i

 

 

i

i

ˆ

i

 

 

 

 

 

 

 

 

i

 

 

 

i

 

 

 

 

yˆ X ˆ

 

 

 

 

 

 

 

 

 

 

 

i

 

i

 

 

 

 

 

 

 

 

 

Взяв супремум по yi

 

в этих неравенствах, получаем (1.

 

 

 

Таким образом, NE-исход дает каждому игроку по крайней мере его гарантированный выигрыш (индивидуальная рациональность), хотя NE-стратегия может и не быть осторожной. С другой стороны, NEисход может не быть оптимальным по Парето. Более того, если каждый NE-исход оптимален по Парето, то возникает борьба за лидерство, делающая практически невозможной нахождение устраивающей всех игроков стратегии.

Пример : игра «перекресток».

Два автомобилиста движутся по двум перпендикулярным дорогам и одновременно встречаются на перекрестке. Каждый из них может остановиться или ехать (обычными правилами движения мы здесь пренебрегаем). Следующая игра 2x2 формализует данную ситуацию в предположении, что каждый игрок предпочитает остановиться, чем пострадать в аварии (исход (ехать, ехать)) и проехать, если другой остановился. Неотрицательное число ε соответствует неудовольствию от созерцания проехавшего, в то время как ты сам вежливо остановился; величина ε определяется этическими нормами общества.

Остановиться

1

1

 

1

2

 

 

Ехать

2

0

 

1

0

 

Остановиться

Ехать

Оба NE-исхода {(остановиться, ехать), (ехать, остановиться)} оптимальны по Парето. Тем не менее они не взаимозаменяемы. Для каждого игрока оптимальной стратегией является остановка, если другой игрок решил проехать перекресток, и проезд, если другой остановился. Высказав решимость

111

придерживаться неосторожной стратегии «ехать», игрок выигрывает, поскольку он заставляет другого остановиться и получает максимальный выигрыш, равный 2.

Но поскольку ни один исход не дает обоим игрокам выигрыш, равный 2, то неизбежна борьба за лидерство. Каждый игрок будет изображать, что он утратил способность переключаться со стратегии «ехать» на стратегию «остановиться» (например, притворяясь разным), и в то же время внимательно наблюдать за своим противником, чтобы выяснить, а вдруг тот и в самом деле не сможет остановиться. Таким образом, наиболее выгодным оказывается нарочно нерациональное поведение.

Рассмотрим детальнее понятие борьбы за лидерство, используя необходимые дополнительные понятия.

Для игры двух лиц X1 , X 2 ,u1 ,u2

обозначим через

BRi

график отображения наилучших

ответов i-го игрока на любую стратегию j-го игрока:

 

 

 

 

 

 

x1 , x2 BRi

u1

x1 , x2

sup u1 y1 , x2

 

 

 

 

 

 

 

yi X 1

 

 

 

 

 

(симметричное определение для BR2 ).

 

 

 

 

 

 

 

 

 

 

Определение. Пара

xS

, xS

 

называется

i-равновесием

 

по

Штакельбергу в игре

 

1

2

 

 

 

 

 

 

 

 

 

 

X1 , X 2 ,u1 ,u2 , если

 

 

 

 

 

xS , xS sup u

 

 

 

 

xS , xS BR

j

и u

y , y

2

,

(2)

1

2

 

 

i

1

2

i

1

 

 

где i, j 1,2 i j .

 

 

 

y1, y2 BR j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Можно интерпретировать 1-равновесие по Штакельбергу на основе следующего сценария: игрок 1

(лидер) знает обе функции выигрыша

u1

и u2 и использует эту информацию для предсказания реакции

игрока 2. Игрок 2 (ведомый)

воспринимает стратегию игрока 1

как заданную извне и максимизирует

собственный выигрыш, полагая, что стратегия x1 игрока 1 фиксирована. Таким образом, игрок1, имея первый ход и предвидя, что игрок 2 использует один из своих наилучших ответов на x1 , находит оптимальное решение задачи (2).

Определение. В игре двух лиц G X1 , X 2 ,u1 ,u2 назовем i-выигрышем по Штакельбергу

Si выигрыш игрока при любом i-равновесии по Штакельбергу:

S

i

sup u

xS , xS ,

i, j 1,2 i j .

 

 

i

1 2

 

xS , xS BR

j

 

 

1 2

 

 

 

Таким образом, Si – это выигрыш игрока i, действующего оптимально в качестве лидера. Будем

говорить, что в игре G имеет место борьба за лидерство, если не существует такого исхода, что

ui x Si ,

i 1,2 . (3)

Лемма. Пусть игра G имеет по крайней мере два оптимальных по Парето NE-исхода x1 , x2 с

различными векторами выигрышей:

u1 x1 ,u2 x1 u1 x2 ,u2 x2 . (4)

Тогда в G имеет место борьба за лидерство.

 

Доказательство. Заметим, что NE G BR1 BR2 . Тогда по определению

x NE G ui x Si ,

i 1,2 .

Если в G нет борьбы за лидерство, то найдется исход x, для которого справедливо (3), что означает

ui

x1 ui

x ,

i 1,2 ,

u

x2 u

x ,

i 1,2 .

i

i

 

 

Поскольку x1 и x2 оптимальны по Парето, то все четыре неравенства должны обратиться в равенства, что противоречит предположению (4).

Справедлива следующая (примем ее без доказательства)

112

Теорема. Пусть

для всех i N

множества

X i

конечны. Если фигура

Г N, Xi i N , ui i N

разрешима по доминированию, то любое сложное равновесие является

равновесием по Нэшу.

 

 

 

 

Обратное утверждение отнюдь не верно: NE-стратегия может быть доминируемой.

Пример: олигополия с назначением выпуска.

 

 

 

 

 

Пусть имеется n производителей с нулевыми затратами, поставляющих на рынок некоторый товар в

количествах

x1 ,..., xn .

Общее предложение

есть

S x1 ... xn , а цена равна

p 0

0 ,

p' y 0 ,

p'' y 0 ,

y 0 , т.е. p – убывающая функция на положительной полуоси.

 

 

 

Эту ситуацию можно представить как следующую

 

 

 

 

 

 

 

X i 0, ,

ui x xi

p S ,

i 1,...,n .

 

 

 

Из условий на p получается, что функция ui

вогнута по

xi . Поскольку X i

не компактные

множества,

положим

Yi

0, Smax ,

где

Smax

– предложение, порождающее

нулевую

цену:

p Smax 0 . Для

усеченной игры Yi ;ui

;i 1,..., n применима теорема Нэша,

позволяющая

утверждать существование NE-исхода x в усеченной игре. На самом деле исход x есть равновесие по Нэшу и

в исходной игре. Действительно, гарантированный выигрыш каждого игрока в усеченной игре есть 0, поэтому по лемме 9.5

 

 

ui

x 0 ui yi , xˆ для yi Smax , .

 

 

 

 

 

i

 

 

 

В силу вогнутости и дифференцируемости ui на множестве xi NE-исход x удовлетворяет системе

(9.13):

 

xi p' S p S 0 .

 

 

 

 

 

 

~

 

Таким образом, игра имеет единственный NE-исход на диагонали x1 x2

... xn

 

x , где

~

~

~

 

 

 

x

p nx

/ p' nx .

 

 

 

Пример: устойчивость в дуополии Курно.

Два игрока поставляют на рынок некоторые количества x1 и x2 одного и того же товара, цена на

который определяется следующим образом:

p x1 x2 1 x1 x2 .

Рассмотрим два различных предположения о функции затрат:

а) постоянные затраты на выпуск единицы продукции при увеличении масштабов производства: затраты на производство y единиц оцениваются величиной 0,5 y для обоих игроков;

б) убывающие затраты на выпуск единицы продукции при увеличении масштабов производства:

затраты на производство y единиц оцениваются величиной 0,5y 0,75y2 для обоих игроков.

Наконец, максимальные производственные возможности обоих игроков равны 0,5 (поэтому цена и

затраты неотрицательны).

 

 

 

 

В случае а) получаем следующую игру:

 

 

 

x2 0;0,5 ,

ui x1 , x2 xi

1 x1

x2 0,5xi ,

i 1,2

Легко вычислить наилучший ответ игрока i на стратегию yj игрока j, поскольку ui вогнута по xi:

BRi {0,25 0,5x j ,0 x j 0,5}.

Единственный NE-исход таков:

NE BR1 BR2 {(1/ 6,1/ 6)}.

Так называемая процедура нащупывания по Курно начинается из начальной позиции ( x10 , x20 ), причем каждый игрок последовательно использует наилучший ответ на текущую стратегию противника:

113

(x10 , x20 ) (x10 , x20 ) ( (x20 ), x20 ) BR1 (x11 , x12 )

(x11 , (x11 )) BR2 ... (x1t , x2t 1 ) ( (x2t 1 ), x2t 1 ) BR1(x1t , x2t ) (x1t , (x1t )) BR2 ...

где α(y)=0,25-0,5y.

Изобразив самостоятельно несколько последовательностей, можно убедиться, что из любой начальной позиции ( x10 , x20 ) последовательности ( x1t , x2t ) сходятся к NE-исходу (1/6,1/6). Говорят, что

(1/6,1/6) является устойчивым NE-исходом.

Обратимся теперь к случаю б). получается следующая игра в нормальной форме:

X

1

X

2

[0; 0,5],

u

(x , x

2

) x

(1 x x

2

) (0,5x

i

0,75 x 2 ),

i 1,2.

 

 

 

i

1

 

i

 

1

 

 

i

 

По-прежнему функция ui вогнута по xi и кривые наилучших ответов имеют вид

 

 

 

 

 

 

BRi

{xi

(x j

),

0 x j

0,5},

 

0,5,

0 y 0,25,

 

где ( y)

 

 

 

1 2y,

0,25 y 0,5.

 

Теперь имеются три NE-исхода:

 

 

 

NE BR1 BR2

{(1/ 3,1/ 3), (1/ 2, 0), (0,1/ 2)}.

Из рис.

5, б видно, что, начиная с любого исхода x0 (1/ 3,1/ 3), последовательность всегда

сходится к (1/ 2, 0) или (0,1/ 2) за конечное число шагов. Это справедливо даже в том случае, когда точка x 0 сколь угодна близка к точке (1/ 3,1/ 3) (но не совпадает с ней). Говорят, что (1/ 3,1/ 3) это

неустойчивый NE-исход, а (1/ 2, 0), (0,1/ 2) - локально устойчивые.

В процедурах нащупывания по Курно исследуется динамический процесс принятия «близоруких» решений, напоминающий механизм совершенной конкуренции. Каждый игрок максимизирует свой выигрыш, полагая, что стратегии остальных игроков фиксированы. Эта процедура не может быть обоснована соображениями рациональности (поскольку предпосылка о том, что все остальные игроки будут неизменно использовать одну и ту же стратегию, постоянно нарушается). Тем не менее, процедура имеет определенную описательную ценность и позволяет разделить NE-исходы на устойчивые и неустойчивые.

Рейтинговая оценка студентов по дисциплине

Итоговая (семестровая) оценка по дисциплине (зачтено) определяется при достижении 60 баллов по всем видам внутрисеместровой аттестации: три контрольные работы (максимальное количество баллов за каждую – 30; реферат -10 баллов).

114

Словарь терминов по теории игр.

Антагонuстuческuе игры – игры в нормальной форме, в которых сумма выигрышей игроков при любом исходе равна нулю.

Активная стратегия игрока – чистая стратегия, входящая в оптимальную смешанную стратегию с ненулевой вероятностью.

Верхняя цена игры (минимакс)

min max aij

 

 

 

 

j

i

 

 

 

 

 

 

 

Гарантирующее

равновесие

это

исход

игры, при котором каждый игрок выбирает действие

yiг Arg max min

fi ( yi , y i ) , где

A i

Aj . Это решение игры называют также максиминным.

yi Ai y i A i

 

 

j i

 

 

Гипотеза рационального поведения – это предположение, что игрок стремится максимизировать свою целевую функцию с учетом всей имеющейся у него информации, т.е. выбирает одну из альтернатив y*,

на которых достигается максимум его целевой функции y* = arg max f(y).

y A

Доминантная стратегия игрока – его действие, которое является наилучшим для него независимо от того, что делают оппоненты. Формально: стратегия yid будет доминантной, если какая бы обстановка игры не складывалась и какое бы действие не выбирал i-ый игрок при этой обстановке, его выигрыш будет

максимальным

 

при

 

выборе

именно

доминантной

стратегии:

yi Ai

y i A i

f

i

( y d

, y

i

) f

i

( y

i

, y

i

) .

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Игра в нормальной форме: игрой в нормальной форме п лиц с произвольной суммой называется

система

Г

Х i

, Ki ,i

N

, где X i – непустые множества действий, Ki

– функции выигрыша игроков,

 

 

 

 

 

 

 

 

 

Ki

: X1 X n 1. Т.е.

предполагается, что игроки

имеют

возможность лишь

один раз

одновременно и независимо друг от друга, не зная выбора противников, выбрать альтернативу (действие) из множества возможных действий; после выбора всех действий реализуется определенный исход. Каждому исходу соответствуют значения функции полезности каждого из игроков или их выигрыши. Всем игрокам известны как зависимость их выигрышей от исхода игры, так и выигрыши противников.

Игры с непротивоположными интересами – игры в нормальной форме, в которых сумма выигрышей может быть различной для разных ситуаций.

Игра с природой – игра (выбор стратегии) одного игрока в условиях природной неопределенности, функция выигрыша которого определяется его выбором (стратегией) и состоянием природы, принадлежащим заданному множеству состояний.

Игра Г2 – это иерархическая игра, в которой игрок (агент) (выбирающий стратегию вторым) не ожидает информации о действии первого игрока (центра) центра, тогда реализация права первого хода

 

 

 

 

 

 

 

 

~

(x2 ) . Такое сообщение

 

центра

может

состоять в

сообщении

центром

агенту

функции x1

может

рассматриваться, как обещание выбрать

действие

~

 

при выборе агентом действия x2.

Тогда

x1 x1(x2 )

 

 

 

 

 

 

 

 

 

~

~

 

стратегия агента состоит в выборе действия в зависимости от сообщения центра, x2 x2

(x1 ( )) . Если при

этом

агент

доверяет

сообщению

центра,

он

должен

выбрать

действие

x* ,

 

 

~

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

реализующее max f 2 (x1 (x2 ), x2 ) .

 

 

 

 

 

 

 

 

 

x2 X 20

 

 

 

 

 

 

 

 

 

Игра Г1

это иерархическая игра,

в которой игрок, выбирающий стратегию вторым (агент) не

ожидает информации о действии центра, тогда реализация права первого хода центра может состоять в

 

~

 

 

 

сообщении центром агенту функции

x1 (x2 ) .

Такое

сообщение может рассматриваться, как обещание

~

 

 

 

Тогда стратегия агента состоит в выборе

выбрать действие x1 x1(x2 ) при выборе агентом действия x2.

действия в зависимости от сообщения центра,

~

~

 

x2 x2 (x1 ( )) . Если при этом агент доверяет сообщению

*

 

 

~

(x2 ), x2 ) .

центра, он должен выбрать действие x2

, реализующее max f 2 (x1

 

 

x2 X 20

 

Иерархическая игра – игра с фиксированной последовательностью ходов.

Иерархия представлений – совокупность представлений агентов о параметрах иерархической игры и их представления о представлениях других агентов и т.д.

Классификация игр. Существует несколько оснований классификаций игр. - по числу участников (два или несколько);

115

-по ограничению на выигрыш (игры с нулевой суммой или антагонистические и игры с произвольной суммой);

-по информированности сторон (с полной и неполной информированностью);

-по количеству повторений (однократные и динамические (с дискретным временем – повторяющиеся,

снепрерывным – дифференциальные);

-по мощности множеств стратегий (дискретные и непрерывные игры);

-по возможности совместных действий (некооперативные и кооперативные игры);

-по последовательности ходов (одновременные и иерархические);

и др.

Критерий Байеса относительно выигрышей (рисков)– максимум ожидаемого выигрыша (минимум ожидаемого риска) в игре с природой при заданных вероятностях ее состояний.

Критерий Лапласа относительно выигрышей (рисков)– максимум ожидаемого выигрыша (минимум ожидаемого риска) в игре с природой при равных вероятностях ее состояний.

Критерий Вальда (критерий крайнего пессимизма) есть частный случай обобщенного критерия Гурвица относительно выигрышей со специальными коэффициентами λ1=1,λ2=0…= λn=0.

Критерий пессимизма-оптимизма Гурвица относительно выигрышей, с показателем оптимизма

[0,1] представляет собой частный случай обобщенного критерия Гурвица относительно выигрышей с коэффициентами 1 1 , 2 ... n 1 0, n .

Kpumepuu Cэвиджa (кpumepuu кpaйнего neccuмизмa) представляет собой частный случай обобщенного критерия Гурвица относительно рисков с коэффициентами λ1=1,λ2=0…= λn=0.

Максимаксный критерий (критерий крайнего оптимизма) представляет собой частный случай обобщенного критерия Гурвица относительно выигрышей, когда коэффициенты λ12,…, λn выбираются следующим образом: λ1=…=λn-1=0, λn=1.

Muниминный кpumepuй (кpumepuu кpaйнего oоптимизма). представляет собой частный случай обобщенного критерия Гурвица относительно рисков, когда коэффициенты 1 , 2 ,..., n выбираются в виде λ1=…=λn-1=0, λn=1.

Нижняя цена игры (максимин) a max min aij

j i

Обобщенный критерий пессимизма-оптимизма Гурвица относительно выигрышей с коэффициентами λ123,…λn .

Переставим выигрыши аi1i2,...,аin при каждой стратегии Ai, (т.е. элементы каждой строки матрицы), расположив их в неубывающем порядке, и обозначим элементы полученной матрицы через bij, пусть числа

n

λ123,…λn, удовлетворяют условиям 0 и 1 . Показателем эффективности стратегии j 1

n

Аi по рассматриваемому критерию назовем число Gi 1 , 2 ,...., n j bij , i 1,..., m. j 1

Обобщенным критерием пессимизма-оптимизма Гурвица относительно выигрышей с коэффициентами

1, 2 ,...., n назовем критерий, по которому оптимальной среди чистых стратегий считается

стратегия i0 . с максимальным показателем эффективности Обстановка игры для i-го игрока i N

есть вектор действий x i (x1, , xi 1, xi 1, , xn ) всех игроков, кроме i-гo.

Обобщенный критерий пессимизма – оптимизма Гурвица относительно рисков с коэффициентами 1 , 2 ,..., n это критерий, по которому оптимальной среди чистых стратегий

считается стратегия

Ai0 c минимальным показателем неэффективности, т.e.

Ri 1 , 2 ,..., n

R 1 , 2 ,..., n

min Ri

1 , 2 ,..., n .

0

 

 

1i m

0

 

 

 

 

 

116

Обстановка игры в смешанных стратегиях для i-гo игрока, i N есть распределение вероятности

(с плотностью i (x i ) j (xj ) ) появления заданной обстановки при использовании игроками

j i

смешанных стратегий j .

Пассивная стратегия игрока – чистая стратегия, входящая в оптимальную смешанную стратегию с нулевой вероятностью

Платежная матрица антагонистической игры – матрица, число строк (столбцов) которой равно числу стратегий одного из двух игроков антагонистической игры, а значения элементов матрицы равны выигрышу (проигрышу) одного из игроков.

Равновесие в доминантных стратегиях (РДС) есть совокупность доминантных стратегий всех игроков (если таковые существуют).

Равновесие в игре Г1 отличается от равновесия Штакельберга тем, что при определении оптимальной

стратегии первого игрока вычисляется минимум по множеству

R (x )

x* Arg max

min f

1

(x , x

2

) .

 

 

 

 

 

 

2

1

1

x1 X10

x2 R2 ( x1 )

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Равновесия Нэша y

N

 

: i N

yi Ai

 

N

N

 

N

 

 

 

 

 

 

A

fi ( yi

, y i

) fi ( yi , y i ) , то есть для любого

игрока и для любого допустимого его действия выбор им равновесного по Нэшу действия дает ему выигрыш не меньший, чем при выборе любого другого действия при условии, что остальные игроки играют равновесные по Нэшу стратегии. Отличие между РДС и равновесием Нэша заключается в том, что в формулировке РДС фигурирует произвольная обстановка, равновесии Нэша – конкретная «нэшевская» обстановка.

Равновесие

Штакельберга в

 

игре

Г1

есть

 

такая

 

пара

действий

(x* , x* )

, что

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

 

x* Arg max

f (x , x

) ,

x* R

2

(x* ) Arg max f

2

(x* , x

2

) , то

есть

R (x )

функция

1

0

 

 

1 1 2

 

2

 

1

 

x2 X 20

1

 

 

2

1

 

 

R2

( x1 )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x1 X1 ,x2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

наилучшего ответа агента на действие центра.Рефлексивная игра ГI - это

игра, описываемая следующим

кортежем:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ГI = {N, (Xi)i N, fi( )i N, , I},

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где

N

множество

реальных

агентов,

Xi

множество

допустимых

действий

i-го

агента,

fi( ): X’ 1

его целевая функция,

i N,

множество возможных значений неопределенного

параметра, I – структура информированности.

Решение игры в самом общем смысле есть любое описание того, каким образом должны вести себя игроки в той или иной игровой ситуации. Это не обязательно должен быть набор рекомендуемых для каждого игрока действий. Решением, например, может быть набор исходов игры. Такое решение можно интерпретировать как набор ситуаций, рациональных относительно некоторых предположений о поведении игроков. То есть при рациональном поведении игроков должны реализовываться только ситуации, принадлежащие решению. Решением игры может быть и набор смешанных стратегий, если одних только чистых стратегий недостаточно.

В настоящее время в теории игр не существует единой концепции решения, одинаково подходящей для

всех классов игр.

 

Седловая

точка матрицы А антагонистической игры – это элемент ai 0 j 0 , что

ai0 j 0 max aij 0

min ai0 j .

i

j

Смешанной стратегия. Игроки могут выбирать одно из действий с некоторой вероятностью. Тогда выбор игрока будет описываться вероятностным распределением на множестве возможных в данной игровой ситуации действий.

Смешанная стратегиея X i i-гo игрока (i N ) для игры в нормальной форме есть распределение вероятности на множестве действий X i с плотностью Xi (xi ) , где xi X i .

Стратегия игрока в игре в развернутой форме есть функция, отображающая множество информационных состояний игрока на множество его ходов таким образом, что каждому информационному состоянию ставится в соответствие один из возможных в данном состоянии ходов. Множества стратегий развернутой игры превращаются во множества действий игры в нормальной форме.

Строго домuнuруемая стратегия игрока i: это cтратегия xi X i , если существует стратегия

yi X i

такая,

что

для

произвольной

обстановки

x i

выполняется

неравенство

Ki ( yi , x i ) Ki (xi , x i ).

117

Cтрого недомuнuруемой стратегией игрока i: это cтратегия xi X i , если для произвольной стратегии yi X i найдется обстановка x i такая, что Ki ( yi , x i ) Ki (xi , x i ).

Структура информированности Ii i-го агента задается набором всевозможных значений вида ij1 ... jl ,

где l пробегает множество целых неотрицательных чисел, j1, …, jl N, а ij1 ... jl .

Структура информированности I игры в целом – набор значений i1 ...il , где l пробегает множество целых неотрицательных чисел, j1, …, jl N, а ij1 ... jl . Структура информированности I «недоступна»

наблюдению агентов, каждому из которых известна лишь некоторая ее часть (а именно – Ii). Таким образом, структура информированности – бесконечное n-дерево (то есть тип структуры постоянен и является n- деревом), вершинам которого соответствует конкретная информированность реальных и фантомных агентов.

Теория игр – часть теории математических моделей принятия оптимальных решений (исследования операций), а именно, она моделирует ситуации принятия оптимальных решений в условиях конфликта.

Формальная модель конфликта (игры) есть следующий кортеж: {множество игроков, множество

стратегий, множество исходов, множество функций выигрыша} Функция выигрыша или целевая функция или функция предпочтения или функция полезности

f ( y) : A 1 , описывающая предпочтения субъекта (игрока), отображает множество его допустимых

действий (альтернатив) A на числовую ось 1. Значения этой функции позволяют сравнивать разные альтернативы (действия). Если есть два варианта – два элемента из множества допустимых действий, то лучшим будет тот, который приводит к большему значению функции.

Чистая стратегия игрока в игре в нормальной форме есть выбор им одного из элементов множества своих действий.

Эффективность по Парето. Вектор действий игроков y P A (точка Парето), принадлежащий

множеству A' допустимых векторов действий, будет эффективным по Парето, если для любого другого вектора действий найдется игрок такой, что значение его целевой функции будет строго меньше, чем в точке Парето: y y P i N fi ( y) fi ( y P ) .

118

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]