Добавил:

Tushkan Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный исследовательский университет «МЭИ»

Предмет:

Теория игр

Файл:

Лекции.doc

Скачиваний:

269

Добавлен:

28.06.2014

Размер:

1.25 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 67 / 187 8 9 10 11 12 13 14 15 16 17 18 > Следующая >>>

Методы решения матричных игр.

A_i \B_j	B₁	…	B_N
A₁(1)
…		\|\|a_ij\|\|
A_N

Проверить на наличии седловой точки.
Если нет седловой точки, то матрицу игры упрощают.

Из матрицы игры исключают доминируемые и дублируемые стратегии.

Задача: найти стратегии S_A =( p₁, p₂…, p_N) и S_B =( q₁, q₂…, q_N), дающие максимальный средний выигрыш.

Игра mxn, число активных стратегий будет равняться min(m,n)

Определение.

Стратегия A_i доминирует ()A_k, то есть A_i A_k, значит:

j a_ij a_kj

Определение.

Стратегия A_i дублирует (=) A_k, то есть A_i = A_k, значит:

j a_ij = a_kj

Стратегия B_j B_r, i a_ij a_rj

Стратегия B_j = B_r, i a_ij = a_rj

A_i \B_j	B₁	B₂	B₃	B₄	B₅
A₁	4	7	2	3	4
A₂	3	5	6	8	9
A₃	4	4	2	2	8
A₄	3	6	1	2	4
A₅	3	5	6	8	9

Пример: игра (5x5)

A₁ A₄

A₂ = A₅

A_i \B_j	B₁	B₂	B₃	B₄	B₅
A₁	4	7	2	3	4
A₂	3	5	6	8	9
A₃	4	4	2	2	8

B₁ B₂

B₁ B₅

A_i \B_j	B₁	B₃
A₁	4	2
A₂	3	6

A₂₁ = A₅

Получим S_A = (p₁, p₂, 0, 0, 0)

S_B = (q₁, 0, q₂, 0, 0)

Метод Лагранжа Этот метод используется в играх с квадратной матрицей игры g(m,m).

	B1	B2
A1	а₁₁	а₁₂
A2	а₂₁	а₂₂

S_A=(p₁,p₂) - вектор вероятностей выбора стратегий игроком А.

S_B=(q₁,q₂) - вектор вероятностей выбора стратегий игроком В.

Пусть игрок А использует смешанные стратегии, а В чистые, тогда выигрыш составит:

V₁=a₁₁*p₁+a₂₁*p₂

V₂=a₁₂*p₁+a₂₂*p₂

если же В также использует смешанные стратегии, то выигрыш составит:

V=( a₁₁*p₁+a₂₁*p₂)*q₁+( a₁₂*p₁+a₂₂*p₂)*q₂

Строится функция Лагранжа:

L=(a₁₁*p₁+a₂₁*p₂)*q₁+(a₁₂*p₁+a₂₂*p₂)*q₂+₁*(p₁+p₂-1)+ ₂*(q₁+q₂-1)

q₁ , q₂

p₁ , p₂

p₂ =1- p₁

q₂ =1- q₁

Получим

;

Пример.

G(2,2)

	B1	B2
A1	4	2
A2	3	6

Метод линейного программирования Этот метод используется в играх с произвольной матрицей игры g(m,n).

	B₁	B₂	…	B_j	…	B_n
A₁	а₁₁	а₁₂	…	а₁_j	…	а₁_n
A₂	а₂₁	а₂₂	…	а₂_j	…	а₂_n
…	…	…	…	…	…	…
A_i	а_i₁	а_i₂	…	а_ij	…	а_in
…	…	…	…	…	…	…
A_m	а_m₁	а_m₂	…	а_mj	…	а_mn

S_A=(p₁,p_2,…, p_i_,…, p_n) - вектор вероятностей выбора стратегий игроком А.

S_B=(q₁,q_2,…, q_j_,…, q_n) - вектор вероятностей выбора стратегий игроком B.

Требование, накладываемое на матрицу - i , j a_ij>0

Для того, чтобы произвольная матрица удовлетворяла этому требованию ищется M=мах(|а_ij||a_ij0) и прибавляется ко всем элементам, получаем a_ij+M>0.

Пусть А выбирает смешанную(оптимальную) стратегию, а В чистую:

Введем величину0, i=1,…,m

Тогда:

(*)x_i0 i=1,…,m

Т.к.

Получаем задачу линейного программирования:

при системе ограничений (*).

Решив ее, найдем (x_1, x_2,…, x_m) и

Зная V, найдем p_i=x_i*V.

<<< < Предыдущая 1 2 3 4 5 67 / 187 8 9 10 11 12 13 14 15 16 17 18 > Следующая >>>

Соседние файлы в предмете Теория игр

#
28.06.2014111.28 Кб24Counterterrorism, a game-theoretic analysis (Daniel G.).pdf
#
28.06.2014136.06 Кб26Terrorism and Game Theory (Todd Sandler).pdf
#
28.06.201420.36 Mб52Имитационное моделирование. Классика CS (Кельтон В., Лоу А.).djvu
#
28.06.201429.18 Кб9Информация к консультации.doc
#
28.06.20141.25 Mб269Лекции.doc
#
28.06.2014289.49 Кб87Моделирование процессов принятия решений на основе системы интеллектуального имитационного моделирования РДО (Еремеев А., Шутова П.).docx
#
28.06.2014288.2 Кб45Моделирование процессов принятия решений на основе системы интеллектуального имитационного моделирования РДО (Еремеев А., Шутова П.).docx
#
28.06.20147.7 Mб67Ответы к экзамену.pdf
#
28.06.20141.24 Mб418Теоретико-игровые методы принятия решений (Еремеев А. П.).doc
#
28.06.201446.59 Кб8Требования к отчетам.doc