Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Teoria_igr_EKZAMEN_teoria.docx
Скачиваний:
2
Добавлен:
01.03.2025
Размер:
881.33 Кб
Скачать
  1. Смешанные стратегии. Функция выигрыша и цена игры в смешанных стратегиях.

Смешанная стратегия игрока – стратегия игрока, состоящая в случайном выборе им одной из своих чистых стратегий с определенной вероятностью, поэтому смешанную стратегию, например, игрока А, имеющего m чистых стратегий можно представить m-мерным вектором Р=(р1,…,рm), рi , i=1,2,…m.

То же относится и к смешанным стратегиям игрока В: Q= (q1, q2, …,qn ) qj≥0 j=1,…,n ∑ qj=1

Смешанной стратегией игрока называется совокупность его чистых стратегий с определёнными для них вероятностями выбора:

, , .

Функцией выигрыша игрока А в смешанных стратегиях называют функцию Н, заданную на декартовом произведении SA*SB множеств смешанных стратегий, ставящую в соответствие с каждой ситуации (P,Q)€ SA*SB в смешанных стратегиях средний выигрыш игрока А в этой ситуации, определяемый как Н(P,Q)= ∑(i=1 m)∑(j=1 n)piaijqj

(P,Q)€SA*SB где Р=(p1,…, pm) Q= (q1, q2, …,qn )

Для любой конечной матричной игры существуют нижняя и верхняя цены игры в смешанных стратегиях. Причем нижняя цена игры α и верхняя цена игры ß в чистых стратегиях, нижняя цена игры V верхняя цена игры V(верхн черта) в смешанных стратегиях удовлетворяют следующим неравенствам α≤ V≤ V(верхн черта)≤ß

Цена игры в смешанных стратегиях – общее значение нижней и верхней цены игры в смеш.стратегиях: V= относительно которых доказано, что они всегда существуют и равны.

Нижняя цена:

Верхняя цена игры:

  1. Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре.

Для каждой смешанной (в частности, чистой) стратегии P € SA игрока А существует (достигается) α (P, SB)=min(QSВ) H(P,Q). Число α (P, SB) – показатель эффективности смешанной стратегии P€SA игрока А относительно множества SВ смешанных стратегий игрока В.

Для каждой смешанной (в частности, чистой) стратегии Q € SB игрока B существует (достигается) ß (Q, SA)=max(PSA) H(P,Q). Число ß (Q, SA) – показатель неэффективности смешанной стратегии Q € SB игрока B относительно множества SA смешанных стратегий игрока A.

Стандартным n-симплексом называется подмножество пространства действительных чисел, определяемое как

.

Его вершинами являются точки:

,

,

.

Стандартным n- симплексом называется подмножество пространства Rn+1 действительных чисел, где ∆n – множество точек t0,…,tn таких, что сумма ti=1 и для любой координаты ti≥0

Ограниченность симплекса – компакт (ограниченное замкнутое множество):

рассмотрим симплекс SA (1 строчка)

норма любого элемента определяется по правилу (2 строчка)

Сначала покажем, что симплекс является ограниченным замкнутым множеством, т.е. компактом.

Рассмотрим симплекс

в евклидовом пространстве . Так как норма вектора в пространстве определяется следующим образом:

,

то для любой точки симплекса справедливо неравенство

,

означающее ограниченность симплекса .

Пусть последовательность точек

, ,

сходится к точке при . Так как сходимость в является покоординатной, то означает, что , . Поскольку , то и .

Так как для каждого k, то

.

Таким образом, предельная точка принадлежит симплексу , что доказывает его замкнутость.

Аналогично и симплекс – компакт в пространстве .

Ограниченность и замкнутость означает, что данный симплекс=компакту.

Если зафиксировать произвольную смешанную стратегию P€SA, то функция выигрыша F(P,Q) ,будет функцией одного аргумента вектора Q, определенной на симплексе SA. из F(P,Q)=∑∑pi aij qj что она непрерывна по аргументу Q на множестве смешанных стратегий игрока В то есть SB. Непрерывная на компакте функция достигает своих нижней и верхней границ а значит для любой P€ SA найдется хотя бы одна точка Q0€ SB:α(P)=min F (P,Q)=F(P,Q0)

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]