Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТИГР.docx
Скачиваний:
5
Добавлен:
26.09.2019
Размер:
220.86 Кб
Скачать

Вопрос 9.

Определение выигрыш-функции в смешанных стратегиях; координатные и векторно-матричные формулы ее представления.

Функция H(P,Q)= ,

Определённая на декартовом произведении SA × SB множеств смешанных стратегий SA и SB соответственно игроков А и В и ставящая в соответствие каждой ситуации (P,Q) ϵ SA × SB в смешанных стратегиях Р=(р1, р2,…, рm) игрока А и Q=(q1, q2,…, qn) игрока В средневзвешенный выигрыш игрока А в этой ситуации, определяемый выражением в правой части равенства H(P,Q)= , называется выигрыш-функцией игрока А в смешанных стратегиях.

Сужение выигрыш-функции Н на декартово произведении SCA × SCB множеств чистых стратегий SCA и SCB совпадает с выигрыш-функцией F в чистых стратегиях, т.е. H(Ai, Bj)=F(Ai, Bj)=aij, i=1,2, …, m; j=1,2,…,n. Поэтому совокупность множеств смешанных стратегий SA и SB игроков А и В и выигрыш-функции игрока А в смешанных стратегиях Н называется смешанным расширением игры в чистых стратегиях.

Выигрыш-функцию в смешанных стратегиях, заданную в координатной форме H(P,Q)= , можно представить и в матричной форме:

Р(P,Q)=PAQT,

Где Р=(р1, р2,…, рm) – вектор-строка смешанной стратегии игрока А размера [1×m]; А – матрица выигрышей игрока А в чистых стратегиях размера [m×n]; QT=(q1, q2,…, qn)T – вектор-столбец размера [n×1] смешанной стратегии игрока В.

Вопрос 10.

Определения нижней и верхней цен игры в смешанных стратегиях и их

существование.

Нижней ценой, или максимином, в матричной игры в смешанных стратегиях называется величина =

Верхней ценой, или минимаксом, матричной игры в смешанных стратегиях называется величина

=

Теорема. Для любой конечной матричной игры существует нижняя и верхняя цены игры в смешанных стратегиях.

Смешанная стратегия Po ϵ SA , максимизирующая показатель эффективности , называется максиминной смешанной стратегией игрока А. Таким образом, =α(Po). Множество всех максиминных смешанных стратегий игрока А обозначим через (SA)maxmin .

Смешанная стратегия Qo ϵSB , минимизирующая показатель неэффективности β(Q), называется минимаксной смешанной стратегией игрока В. Таким образом, . Множество всех минимаксных смешанных стратегий игрока В обозначим через (SB)minmax.

Нижняя цена игры α и верхняя цена игры β в чистых стратегиях, нижняя цена игры и верхняя цена игры в смешанных стратегиях удовлетворяют следующим неравенствам

α≤ ≤ ≤β

Теорема

Для любой конечной матричной игры существуют нижняя и верхняя цены игры в смешанных стратегиях.

Доказательство:

Так как функция α(Р) непрерывна на компакте SA, то она достигает на этом множестве своего максимума, т.е. существует нижняя цена игры в смешанных стратегиях:

Аналогичным образом обосновывается существование и верхней цены игры в смешанных стратегиях.

11. Критерий существования седловых точек

Седловым элементом матрицы называется элемент, являющийся минимальным в своей строке и максимальным в своем столбце.

Ситуацию (s*t*) назовем седловой точкой игры  = <S, T, >, если

sS tT ( st*)  ( s*t*)  ( s*t). (3)

Теорема 2 (критерий существования седловой точки).

Для того, чтобы матричная игра  = <S, T, > имела седловые точки необходимо и достаточно, чтобы были равны величины  и .

Доказательство.

Необходимость.

Пусть (s*t*) – седловая точка, т. е. выполнено (3).

  1. Так как ( sit*)  ( s*t*), а ( s*t*) – число, то

,

а отсюда следует (берем минимум по j, от которого левая часть не зависит), что

(4)

  1. Так как ( s*t*)  ( s*tj), а ( s*t*) – число, то

,

а отсюда следует, что

(5)

  1. Объединяя (4) и (5), получаем   ( s*t*)  .

Поскольку по теореме о минимаксе и максимине   , то  = .

Замечание 1.

В равенстве (3) s* и t* максиминная и минимаксная стратегии соответственно.

Достаточность.

Пусть выполнено  = , т. е. .

Обозначим

s*S : ,

t*T : .

Докажем, что (s*t*) – седловая точка.

(а) (б)

Поскольку  = , то в последней цепочке все неравенства выполняются в виде равенств. Следовательно, получаем:

Из (а): j

Из (б): i

Последние два неравенства и дают (3).

Теорема доказана.