
- •Загальні відомості
- •Глава 1 Задача теорії розкладу
- •Питання для самоперевірки
- •Задачі для самостійної роботи
- •Глава 2 екстремальні задачі на графах
- •2.1 Основні поняття
- •2.2 Способи задання графа
- •1 Матриця суміжності вершин
- •2 Матриця суміжності ребер графа
- •3 Матриця інцидентності
- •2.3 Дерева та ліс. Остовне дерево графа
- •2.4 Алгоритм побудови остовного дерева зв’язного графа
- •2.5 Знаходження найкоротшого шляху в орієнтованому графі
- •2.6 Мережевий граф та його розрахунок
- •2.7 Задача про максимальну течію в мережі
- •Глава 3 метод гілок та меж
- •3.1 Основні поняття
- •3.2 Задача про рюкзак
- •3.3 Задача комівояжера
- •Глава 4 задача про призначення (вибір)
- •Глава 5 теорія ігор
- •5.1 Платіжна матриця. Нижня та верхня ціна гри
- •5.2 Розв’язання гри у мішаних стратегіях
- •5.4 Геометрична інтерпретація гри
- •5.5 Розв’язання ігор та
- •5.6 Розв’язання ігор
- •Глава 6 елементи теорії масового обслуговування
- •6.1 Основні поняття
- •6.2 Системи масового обслуговування з відмовами
- •6.3 Системи масового обслуговання з очікуванням (чергою)
- •Глава 1 Задача теорії розкладу...........................................................................4
- •Глава 2 Екстремальні задачі на графах...............................................................5
- •Глава 3 Метод гілок та меж.................................................................................31
- •Глава 4 Задача про призначення (вибір).............................................................44
- •Глава 5 Теорія ігор................................................................................................47
- •Глава 6 Елементи теорії масового обслуговування...........................................62
- •Навчальне видання
- •Дослідження операцій
5.1 Платіжна матриця. Нижня та верхня ціна гри
Розглянемо парну кінцеву гру. Нехай
гравець А має m особистих
стратегій, які позначають А1,
А2,…, Аm. У гравця
В є n особистих стратегій,
позначимо їх В1, В2,…,
Вn. В цьому випадку кажуть,
що гра має розмір
.
В результаті вибору гравцями будь-якої
пари стратегій Аi і Вj
(i = 1, 2,…, m; j = 1, 2,…, n)
однозначно визначається результат
гри, тобто виграш aij гравця
А (додатній або від’ємний) і програш
(–aij) гравця В. Припустимо,
що значення aij відомі
для будь-якої пари стратегій (Аi,
Вj). Матриця Р = (aij),
(i = 1, 2,…, m; j = 1, 2,…, n)
називається платіжною матрицею,
або матрицею гри. Загальний вигляд
такої матриці:
.
Приклад. Гра «вірю – не вірю». Правила гри: Гравець А має на руках 8 карт – 4 тузи і 4 двійки. Він витягує карту, не показуючи її гравцю В, і говорить: «туз» (при цьому він може збрехати, а може сказати правду). Якщо гравець В вірить, то він сплачує гравцю А 1 грн. Якщо гравець В не вірить, то гравець А показує карту і якщо це дійсно «туз», то гравець В платить гравцю А 2 грн. Якщо це «двійка», то гравець А сплачує гравцю В 2 грн. Якщо гравець А витягує «двійку» і говорить правду, то він сплачує гравцю В 1грн.
Розв’язання. У гравця А є дві стратегії: А1 – правда, А2 – брехня. У гравця В є дві стратегії: В1 – вірю, В2 – не вірю. Складемо матрицю платежів. Вона має вигляд
.
Знайдемо елементи матриці aij.
Нагадаємо, що ймовірність витягти «туз» дорівнює 0,5 і ймовірність витягти «двійку» теж дорівнює 0,5. При цьому зауважимо, якщо гравець А твердить, що він витягнув «двійку», то гравцю В не має сенсу не вірити, і якщо гравець витягнув «туз», то йому немає сенсу брехати. Тоді при стратегіях
А1В1 : а11 = 0,5·1+0,5·(-1) = 0,
А1В2 : а12 = 0,5·2+0,5·0 = 1,
А2В1 : а21 = 0,5·0+0,5·1 = 0,5,
А2В2 : а22 = 0,5·0+0,5·(-2) = -1.
Таким чином, маємо наступну платіжну матрицю:
.
Далі розглянемо гру з матрицею Р = (aij), (i = 1, 2,…, m; j = 1, 2,…, n) і визначимо найкращу серед стратегій А1, А2,…, Аm.
Наведемо міркування гравця А. Вибираючи стратегію Аi, гравець А повинен розраховувати, що гравець В відповість на неї стратегією Вj, для якої виграш для гравця А є мінімальним.
Позначимо через i
– найменший виграш гравця А при
виборі ним стратегії Аi
для всіх можливих стратегій гравця В
(найменше число в і-му рядку платіжної
матриці), тобто
.
Серед всіх чисел і
(i = 1, 2,…, m) виберемо
найбільше
.
Назвемо –
нижньою ціною гри, або максиміном.
Це гарантований виграш гравця А при
будь-якій стратегії гравці В.
.
Стратегія, що відповідає максиміну, називається максимінною стратегією.
Гравець В зацікавлений у тому, щоб
зменшити виграш гравця А. Вибираючи
стратегію Вj, він враховує
максимально можливий при цьому виграш
для А. Позначимо
.
Серед всіх чисел j
виберемо найменше
.
І назвемо –
верхньою ціною гри, або мінімаксом.
Це гарантований програш гравця В.
Стратегія, що відповідає мінімаксу, називається мінімаксною стратегією.
Встановимо зв’язок між і . Нехай досягається на r-й стратегії (тобто = r), а на стратегії s (тобто =s). На перетині r-го рядка s-го стовпця знаходиться елемент ars. Тоді ≥ ars ≥ . Тобто ≤ .
Якщо верхня та нижня ціни гри співпадають, то їх спільне значення позначається v і називається чистою ціною гри, або ціною гри. В такому випадку в платіжній матриці існує елемент ars , який дорівнює ціні гри, тобто
= ars = = v.
При цьому гравець А має максимальний гарантований виграш v, який не залежить від поведінки гравця В, якщо застосує стратегію Аr, а гравець В досягне мінімального програшу v (незалежного від поведінки гравця А), якщо застосує стратегію Вs. Кажуть, що розв’язок гри має стійкість, тобто, якщо один з гравців дотримується своєї оптимальної стратегії, то для другого не може бути вигідним відхилення від своєї оптимальної стратегії. Елемент ars у цьому випадку називається сідловою точкою.
Позначимо через А* і В* – пару чистих стратегій, на яких досягається розв’язок гри в задачі з сідловою точкою (А*= Аr, В*= Вs). Введемо в розгляд функцію виграшу у першого гравця на кожній парі стратегій: F(Аi, Вj) = aij.
Тоді з умови оптимальності у сідловій точці виконується подвійна нерівність:
F(Аi, В*) ≤ F(А*, В*) ≤ F(А*, Вj),
1 ≤ i ≤ m, 1 ≤ j ≤ n.
Дійсно, вибір стратегії А* першим гравцем при оптимальній стратегії В* другого гравця максимізує мінімальний можливий виграш:
F(А*, В*) ≥ F(Аi, В*),
а вибір стратегії В* другим гравцем при оптимальній стратегії А* першого гравця мінімізує максимальний програш:
F(А*, В*) ≤ F(А*, Вj).
Приклад. Визначити нижню і верхню ціну гри, що задана платіжною матрицею:
У даному прикладі
= max(i) = 3 ,
= min(j) = 3,
= = 3.
Таким чином, А3, В3 – урівноважені стратегії. Гра має сідлову точку а32 і ціну гри v = 3.