Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Tpr.docx
Скачиваний:
39
Добавлен:
01.04.2022
Размер:
2.08 Mб
Скачать

41. Сведение позиционной игры к матричной в условиях неполной информации. На примере двухходовых и трехходовых игр.

Нормализация двухходовой игры с неполной информацией.

Перед нами двухходовая игра, где каждый игрок на каждом ходе имеет две альтернативы.

I ход: A выбирает число

II ход: B выбирает число , не зная выбора числа x игроком A.

Каждый игрок имеет по две альтернативы:

Приведем матрицу выигрышей для игрока A:

B1

B2

A1

a

b

A2

c

d

Тогда имеет матрицу выигрышей:

B1

B2

A1

1

-1

A2

-2

2

, значит, игра не имеет решения в чистых стратегиях. Будем искать в смешанных.

Нормализация трехходовой игры с неполной информацией.

  1. Пусть первых ход делает A, он выбирает число

  2. Второй ход делает игрок B, выбирая из множества , не зная выбора, сделанного игроком A

  3. Третий ход делает A, выбирая , не зная ни x, ни y.

После этого игроки расплачиваются.

У игрока B – 2 стратегии.

В данном примере у игрока A будет 4 стратегии, записанные в формате

Функция выигрышей -

Тогда

42. Сведение позиционной игры к матричной в условиях полной информации о стратегиях соперника.

Рассмотри ПИ двух лиц, каждое из которых делает по одному ходу. Игрокам известны ходы противника, т. е. перед нами двухходовая игра с полной информацией.

Пусть у каждого игрока имеются всего по 2 альтернативы.

A выбирает число

B выбирает число

a, b, c, d – выигрыши игрока A

В результате игры A получается выигрыши a, b, c, d.

Нормализуем данную позиционную игру. Укажем множество стратегий.

Игрок A имеет лишь две стратегии.

У игрока B имеется 4 стратегии. Зададим стратегии игрока B упорядоченной парой чисел:

– альтернатива игрока B при условии

– альтернатива игрока B при условии

[2,1] – эта стратегия игрока B означает, что на первом ходе A выбрал стратегию , тогда B выбирает , если же A выбирает , то B выбирает .

Составим платежную матрицу игры.

Пусть – функция выигрыша, тогда:

Получим матрицу P:

V = -1

(

Позиционная игра с полной информацией всегда имеет решение в чистых стратегиях.

43. Позиционные игры со случайными ходами. 1)1 ход делает случайно игрок О(природа) выбирает x 2 ход А: y , не зная выбора на 1 ходе(х) 3 ход В: z . После чего игроки расплачиваются. -2 4 1 -4 3 0 -3 -5

В

В

В

В

1 2 1 2 1 2 1 2

А

А

1 2 1 2

О

1 2

A: A1={y=1}, A2={y=2}; B:[z1,z2], z1,z2 {1,2}. Если x=1, то z=z1, если х=2, то z=z2.

X=1

B1[1,1]

B2[1,2]

B3[2,1]

B4[2,2]

A1(y=1)

w(1,1,1)

w(1,1,1)

w(1,1,2)

w(1,1,2)

A2(y=2)

w(1,2,1)

w(1,2,1)

w(1,2,2)

w(1,2,2)

X=2

B1[1,1]

B2[1,2]

B3[2,1]

B4[2,2]

A1(y=1)

w(2,1,1)

w(2,1,2)

w(2,1,1)

w(2,1,2)

A2(y=2)

w(2,2,1)

w(2,2,2)

w(2,2,1)

w(2,2,2)

(A1,B1)-оптимальная ситуация vA=0.5 2) 1 ход О: x Если х=1, то на 2 ходе А выбирает y , зная х 3 ход: В: z , зная х, не зная у Если х=2, то на 2 ходе В: y , зная х 3 ход: А: z , зная х, не зная у

-2 4 1 -4 3 0 -3 -5

В

В

А

А

1 2 1 2 1 2 1 2

А

В

1 2 1 2

О

1 p 1-p 2

A: (y,z), y,z , Если x=1, то у; Если х=2, то z; B: (y,z), y,z , Если x=1, то z; Если х=2, то y

X=1

B1(1,1)

B2(1,2)

B3(2,1)

B4(2,2)

A1(1,1)

w(1,1,1)

w(1,1,2)

w(1,1,1)

w(1,1,2)

A2(1,2)

w(1,1,1)

w(1,1,2)

w(1,1,1)

w(1,1,2)

A3(2,1)

w(1,2,1)

w(1,2,2)

w(1,2,1)

w(1,2,2)

A4(2,2)

w(1,2,1)

w(1,2,2)

w(1,2,1)

w(1,2,2)

X=2

B1(1,1)

B2(1,2)

B3(2,1)

B4(2,2)

A1(1,1)

w(2,1,1)

w(2,1,1)

w(2,2,1)

w(2,2,1)

A2(1,2)

w(2,1,2)

w(2,1,2)

w(2,2,2)

w(2,2,2)

A3(2,1)

w(2,1,1)

w(2,1,1)

w(2,2,1)

w(2,2,1)

A4(2,2)

w(2,1,2)

w(2,2,2)

w(2,2,2)

w(2,2,2)

PA=p . p= => PA=