Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТППР_лекції_2015.docx
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
844.46 Кб
Скачать

9.1.1.2. Методи рішення кінцевих ігор

Перед рішенням гри m n її спрощують, позбуваючись від зайвих стратегій.

Стратегія Ai гравця A називається домінуючою над стратегією Ak , якщо в рядку Ai знаходяться виграші, не менші, ніж у рядку Ak і хоча б один з них більший, ніж у відповідній клітинці рядка Ak .

Якщо всі виграші рядка Ai рівні відповідним виграшам рядка Ak , то стратегія Ai називається дублюючою стратегію Ak .

Аналогічно визначаються домінуючі і дублюючі стратегії гравця B.

Наприклад, нехай гра 55 задана матрицею гри 55.

Матриця гри 5  5

Стратегії

B1

B2

B3

B4

B5

A1

4

7

2

3

4

A2

3

5

6

8

9

A3

4

4

2

2

8

A4

3

6

1

2

4

A5

3

5

6

8

9

Стратегія A5 дублює A2 , її необхідно видалити. Стратегія A1 домінує над A4. Стратегію A4 видаляють. Результат – наступна матриця гри 35.

Матриця гри 3 х 5

Стратегії

B1

B2

B3

B4

B5

A1

4

7

2

3

4

A2

3

5

6

8

9

A3

4

4

2

2

8

Щодо гравця B, розглядаються варіанти домінування стратегій з погляду його критерію: "віддавати поменше". Тому стратегія B3 домінує над B4 і B5 , а B1 – над B2. Відкидають стовпці: B2, B4 , B5 .

Результатом є наступна матриця.

Матриця гри 3 х 2

Стратегії

B1

B3

A1

4

2

A2

3

6

A3

4

2

У матриці гри 32 A3 дублює A1. Остаточно отримана матриця гри 2 2.

Матриця гри 2 х 2

Стратегії

B1

B3

α

A1

4

2

2

A2

3

6

3

β

4

6

Ця гра не має "сідлової точки", виграшем є нижня ціна гри, яка дорівнює 3.

Загальне правило рішення кінцевої гри полягає в такому: нехай є гра mn, яка не має сідлової точки з матрицею aij (табл. 9.1). Нехай усі виграші позитивні (цього завжди можна добитися, додаючи до всіх членів матриці велике число M).

Ціна гри збільшиться на M, а рішення не зміниться.

Ціна гри в цьому випадку теж позитивна v> 0.

Необхідно знайти рішення гри, тобто дві оптимальні змішані стратегії Sa*= (p1,p2,…,pm), Sb*= (q1, q2,…,qn), які надають кожній стороні максимально можливий для неї середній виграш (мінімальний програш).

Знайдемо спочатку Sa* . Відомо, що якщо гравець A застосовує свою оптимальну стратегію, то гравцю B немає сенсу відступати від своєї оптимальної стратегії.

Якщо гравець A використовує оптимальні стратегії Sa*, а гравець B стане використовувати чисті стратегії B1,B2,…,Bn , то виграш гравця A буде не менше ніж v:

a11p1 +a12p2 +…+am1pm v,

a12p1 +a22p2 +…+am2pm v,

…………………………………. (9.2)

a1n p1 +a2n p2 +amn pm v.

Розділивши члени нерівності на v і обравши позначення: xi=pi/v, отримаємо:

a11x1 +a12x2 +…+am1xm ≥ 1,

a12x1 +a22x2 +…+am2xm 1,

…………………………………. (9.3)

a1n x1 +a2n x2 +amn xm 1.

Внаслідок того, що p1 + p2 +…+ pm =1, сума змінних xi дорівнює:

x1 + x2 +…+ xm =1/v . (9.4)

Значення виграшу v повинне отримати максимальне значення, тому 1/v повинне стати мінімальним.

Задача рішення гри звелася до задачі мінімізації лінійної функції змінних xi при лінійних обмеженнях – нерівностях.

F = x1 + x2 +…+ xm min . (9.5)

Задача рішення гри m n звелася до задачі лінійного програмування з обмеженнями нерівностями і змінними.

Знаючи xi і 1/v , можна знайти p1,p2,…,pm і, значить знайти Sa* .

Оптимальна стратегія гравця B знаходиться аналогічно, з тією різницею, що він прагне мінімізувати виграш, обернувши в максимум 1/v і в обмеженнях фігурує знак менше або дорівнює.

Пара задач лінійного програмування, по якій знаходять оптимальні стратегії (Sa*, Sb*), є парою подвійних задач лінійного програмування, які дають однакове значення змінних xi і v.

Нижче наведений спрощений приклад, що підтверджує безпосередній зв'язок між теорією ігор і задачею лінійного програмування.

Нехай гравець A – дистриб'ютор нової продукції на незнайомому для нього ринку, гравець B – покупець. Гравець A зацікавлений у реалізації більшої кількості продукції, але на цьому ринку поводиться обережно. Гравець B не бажаючи втрачати гроші на придбання незнайомої продукції, теж поводиться обережно. Обидва керуються принципом мінімакса.

Гра задана матрицею 33. Елементи матриці – прибуток від реалізації продукції (виграш гравця A який відповідає стратегіям гравців).