- •Тема 1.Теорія ігор
- •Основні поняття теорії ігор
- •Оптимальність
- •Рівновага
- •Класифікація ігор.
- •Матричні ігри двох осіб з нульовою сумою. Матриця гри. Верхня та нижня ціна гри. Теорема про мінімакс
- •Змішані стратегії в іграх двох осіб з нульовою сумою.
- •Представлення гри у вигляді задач лінійного програмування.
- •Ігри порядку 2 2, 2 n та m 2. Графічне розв’язування ігор.
- •Кооперативні ігри та методи їх дослідження.
- •Алгоритм Воробйова
- •Алгоритм Лемке – Хоусона
- •Пошук ситуацій рівноваги за Нешем (алгоритм Мулена)
- •Поняття про позиційні ігри.
- •Прийняття рішень в умовах невизначеності
Пошук ситуацій рівноваги за Нешем (алгоритм Мулена)
Відомий французький спеціаліст Ерве Мулен наводить алгоритм пошуку повністю змішаного NE-розв’язку для квадратних біматричних ігор. Алгоритм базується на лемі та її доведенні і є дуже зручним для практичного застосування (хоча й у звуженому колі задач).
Припустимо,
що ситуація (X*,Y*) – NE-рівновага у змішаних
стратегіях. Тоді згідно теореми про
NE-рівновагу у змішаних стратегіях
отримуємо наступну систему
,
де
(відповідно
)
- NE-виграш гравця 1 (відповідно гравця
2), k – індекс чистої стратегії гравця
1, l – індекс чистої стратегії гравця 2,
а
(відповідно
)
– вектор, всі компоненти якого дорівнюють
1.
Л
е м а. Нехай
-
біматрична гра. Якщо вона має NE-точку у
змішаних стратегіях (X,Y), то ця точка
єдина і задається наступним чином:
,
де
,
.
Навпаки, якщо вектори X, Y задовільняють цій системі і всі їх компоненти невід’ємні, то пара (X,Y) є змішаним NE-результатом у грі Г.
Доведення:
В системі домноживши перше рівняння на
,
отримаємо
.
Домноживши на
,
отримаємо
.
Отже, число
.
Зворотнє
твердження:
Зауваження. (X,Y) – досить змішаний NE-результат лише за умови додатності всіх його компонент. Система цього не гарантує. Для обчислювальних цілей краще представляти рівноважні виграші в наступним чином:
,
,
де
- алгебраїчні доповнення елемента (X,Y)
у матрицях А, В.
Однак знаходження ситуації рівноваги не означатиме, що знайдений розв’язок є оптимальним чи визначеним.
Приклад. Нехай біматрична гра задана наступною матрицею.
або
утворюють ситуації рівноваги (перевіряється
безпосередньою підстановкою в фомули),
тобто відхилення від ситуації рівноваги
приводить до зменшення виграшу. Однак
перша ситуація значно краща для гравця
А (виграє 5 одиниць, в той час як В — 2), в
той час як друга (з точністю до навпаки)
— для гравця В. В той же час один з
гравців, що перебуватиме в гіршій
ситуації, може прагнути погіршити її
ще більш для себе — наприклад гравець
В, знаходячись в першій ситуації
рівноваги, може прагнути змінити
стратеґію на
— у цьому випадку його виграш дорівнюватиме
нулю, але й виграш гравця А теж стане
нульовим, і якщо А прагнутиме до виграшу,
він може перейти до другої ситуації
рівноваги. Таким чином, в безкоаліційній
біматричній грі врешті-решт, незважаючи
на існування ситуацій рівноваги,
невідомо, до якого результату можуть
прийти гравці (ситуацій рівноваги —
декілька, і вони нерівноцінні для гравців
!!!) і як вони повинні діяти. В той же час,
якщо припустити можливість співпраці
з оплатою іншому гравцеві, то встановивши
оплату для гравця В за рахунок гравця
А в першій ситуації рівноваги в розмірі
1,5 одиниці та в іншій таку ж але для
гравця А за рахунок В, ми отримаємо дві
еквівалентні стійкі ситуації рівноваги
в грі.
Таким чином на основі цього невеликого аналізу можна зробити наступні висновки:
існування ситуацій рівноваги в безкоаліційних іграх не визначає, взагалі кажучи, їх розв’язків, і однозначні рекомендації для оперуючих сторін відсутні;
в багатьох випадках корисні (і навіть необхідні) контакти та угоди між гравцями, а тому моделі, що дозволяють кооперування, мають переваги;
часткові постановки не виключають можливості використання теорії безкоаліційних ігор, і питання про пошук ситуацій рівноваги повинно досліджуватися окремо в кожному окремому випадку.
Перехід конфліктуючих сторін до різних форм співробітництва (кооперування) створює якісно нові ситуації. В іграх з n учасниками розглядається три рівні взаємодії:
обмін інформацією про перебіг гри та ситуації, що складаються;
сумісний вибір стратеґій на ґрунті загальної домовленості та взаємної інформованості;
об’єднання активних засобів (ресурсів) з відповідною координацією дій.
Кожен ступінь кооперування базується на передачі якихось даних з боку одних учасників гри до інших. Умови нормального розвитку гри можуть бути порушені за рахунок передавання спотвореної інформації — обману суперника, який має неповну інформацію.
В більшості випадків вважаємо, що інформація, якою обмінюються учасники конфлікту, має об’єктивну вартість. До поширеного виду колективних дій належить випрацювання єдиного критерію коаліції, після чого вона може розглядатися як одна оперуючп сторона.
Важливим фактором, який визначає характер кооперування, є побічні виплати — “вступний внесок”, “податок на кооперацію”, “штраф за вихід з кооперації”. В цих випадках йдеться про зміну виграшів в той чи інший бік порівняно з початковими умовами гри, а тому побічні виплати перетворюються в частину стратеґій, що застосовуються, та впливають на результат конфлікту.
