- •Тема 1.Теорія ігор
- •Основні поняття теорії ігор
- •Оптимальність
- •Рівновага
- •Класифікація ігор.
- •Матричні ігри двох осіб з нульовою сумою. Матриця гри. Верхня та нижня ціна гри. Теорема про мінімакс
- •Змішані стратегії в іграх двох осіб з нульовою сумою.
- •Представлення гри у вигляді задач лінійного програмування.
- •Ігри порядку 2 2, 2 n та m 2. Графічне розв’язування ігор.
- •Кооперативні ігри та методи їх дослідження.
- •Алгоритм Воробйова
- •Алгоритм Лемке – Хоусона
- •Пошук ситуацій рівноваги за Нешем (алгоритм Мулена)
- •Поняття про позиційні ігри.
- •Прийняття рішень в умовах невизначеності
Поняття про позиційні ігри.
Позиційна гра — це природнє розширення матричної гри двох гравців з нульовою сумою, в якій може брати участь скінчена кількість гравців, кожен з яких може робити послідовно скінчену кількість ходів, причому деякі з них можуть бути випадковими, а інформація про них може змінюватися від одного до іншого ходу. Такі ігри можуть бути формалізовані, певним чином перетворені до гри, що еквівалентна до деякої матричної гри двох гравців з нульовою сумою. Процес приведення позиційної гри до матричної називається нормалізацією, а отримана матрична гра — грою в нормальній формі.
Приклад. Дві корпорації мають бажання встановити між собою ділові зв’язки і вирішити питання про побудову на території другої корпорації виробництва. Гра складається з трьох ходів. Перша корпорація обирає число з множини {1,2}. Після цього друга корпорація обирає число з множини двох можливих {1,2}, знаючи, який вибір здійснила перша корпорація на першому ході. Третій хід робить перша корпорація: знаючи, який хід зробила друга корпорація, та пам’ятаючи про свій вибір на першому кроці, обирає число з множини {1,2}. На цьому гра завершується і розподіляються виграші: перший гравець виплачує другому певну суму, визначену функцією M(x,y,z), яка визначена наступним чином в залежності відвибору гравцями 1-го — 3-го ходів x,y, та z відповідно:
M(1,1,1)=-2; M(1,1,2)=-1; M(1,2,1)=3; M(1,2,2)=-4;
M(2,1,1)=5; M(2,1,2)=2; M(2,2,1)=2; M(2,2,2)=6.
Змістовна інтерпретація цієї гри є наступною:
Хід 1. 1-а корпорація здійснює вибір з двох альтернатив: x=1 — запропонувати 2-й побудувати на її території складальне виробництво комп’ютерів, x=2 — побудувати виробництво мікропроцесорів.
Хід 2. 2-а корпорація, знаючи, яку альтернативу обрала 1-а на першому ході, здійснює вибір з двох альтернатив: y=1 — будувати складальне виробництво та запропонувати це 1-й корпорації; y=2 — будувати виробництво мікропроцесорів та запропонувати це 1-й.
Хід 3. 1-а корпорація, знаючи вибір другої на другому ході та пам’ятаючи свій вибір на першому ході, здійснює вибір з двох альтернатив: z=1 — погодитися з пропозицією 2-ї, z=2 — не погодитися з пропозицією 2-ї.
Після того, як зроблені ходи, партія зіграна, і 1-а корпорація отримує суму M(x,y,z).
Для нормалізації цієї гри необхідно відтворити стратеґії 1-го та 2-го гравця.
Стратеґії 2-го гравця:
В1 — обрати y=1 не зважаючи на вибір 1-го гравця на першому ході;
В2 — обрати y=2 не зважаючи на вибір 1-го гравця на першому ході;
В3 — погодитися з вибором 1-го гравця на першому ході, тобто обрати y=1, якщо x=1, і y=2, якщо x=2;
В4 — не погодитися з вибором 1-го гравця на першому ході, тобто обрати y=2, якщо x=1, і y=1, якщо x=2.
Таким чином 2-й гравець має 4 стратеґії.
Стратеґії 1-го гравця будуються аналоґічно з врахуванням раніше зроблених виборів: вибір на першому кроці дає дві можливості, після вибору другого гравця з’являється чотири варіанти, і реалізація на третьому ході — 8 стратеґій дії для 1-го гравця. Таким чином стратеґію 1-го гравця зображатимемо за допомогою трійки (i,i1,i2) — де і — вибір 1-го гравця на 1-му ході; і1— вибір 1-го гравця на третьому ході за умови, вибору на 2-му ході 2-м гравцем у=1; і2 — вибір 1-го гравця на 3-му ході за умови, вибору 2-м на 2-му ході у=2.
Враховуючи відтворені стратеґії, будуємо матрицю цієї гри.
|
B1 |
B2 |
B3 |
B4 |
A1 (1,1,1) |
M(1,1,1)=-2 |
M(1,2,1)=3 |
M(1,1,1)=-2 |
M(1,2,1)=3 |
A2 (1,1,2) |
M(1,1,1)=-2 |
M(1,2,2)=-4 |
M(1,1,1)=-2 |
M(1,2,2)=-4 |
A3 (1,2,1) |
M(1,1,2)=-1 |
M(1,2,1)=3 |
M(1,1,2)=-1 |
M(1,2,1)=3 |
A4 (1,2,2) |
M(1,1,2)=-1 |
M(1,2,2)=-4 |
M(1,1,2)=-1 |
M(1,2,2)=-4 |
A5 (2,1,1) |
M(2,1,1)=5 |
M(2,2,1)=2 |
M(2,2,1)=2 |
M(2,1,1)=5 |
A6 (2,1,2) |
M(2,1,1)=5 |
M(2,2,2)=6 |
M(2,2,2)=6 |
M(2,1,1)=5 |
A7 (2,2,1) |
M(2,1,2)=2 |
M(2,2,1)=2 |
M(2,2,1)=2 |
M(2,1,2)=2 |
A8 (2,2,2) |
M(2,1,2)=2 |
M(2,2,2)=6 |
M(2,2,1)=6 |
M(2,1,2)=2 |
Розв’язком гри є дві сідлові точки, ціна гри — 5.
Побудуємо дерево позиційної гри. В цьому дереві вузол позначатиме номер гравця, що робить хід, а дуга — його хід. Листя дерева відображатимуть виграші, а кожний шлях від кореня до листка — партію.
Для відображення необхідних даних про зроблені вибори при певних ходах гравців за умов їх різної інформованості на різних ходах на дереві позиційної гри пунктиром позначатимемо інформаційні множини вузлів.
Оскільки 1-й хід робить 1-й гравець, то корінь відповідатиме ходу 1-го гравця та позначається 1. 2-й гравець робить 2-й хід, а тому вузли наступного рівня позначені 2, і так як йому відомий вибір 1-го гравця на першому ході, то він, здійснюючи свій хід, в момент здійснення ходу знає точно, де він (на якій гілці дерева) знаходиться — а тому кожен вузол нижнього рівня утворює окрему інформаційну множину (внаслідок повного знання ходів кожен з вузлів дерева цієї гри є окремою інформаційною множиною).
Приклад 2. Порівняно з попереднім прикладом третій хід робить 1-й гравець, але вже не пам’ятаючи про те, який хід він зробив першим та не знаючи, який другий хід зробив другий гравець (1-го гравця можна уявити, як 2 особи, що знаходяться в окремих кімнатах та які не мають змоги обмінюватися інформацією). Відповідне дерево гри з інформаційними множинами наведене нижче.
Приведемо гру до нормальної форми. У 2-го гравця є 4 таких же стратеґії, як і в попередньому випадку. У 1-го гравця можливості зменшуються за рахунок недостачі інформації: оскільки він на 3-му ході не знає попередніх виборів, то його стратеґія складається з пари чисел (x,z), тобто обрати 1 або 2 на 1-му ході та 1 або 2 на 3-му ході. Відповідна матриця гри буде мати наступний вигляд.
|
B1 |
B2 |
B3 |
B4 |
A1 (1,1) |
M(1,1,1)=-2 |
M(1,2,1)=3 |
M(1,1,1)=-2 |
M(1,2,1)=3 |
A2 (1,2) |
M(1,1,2)=-1 |
M(1,2,2)=-4 |
M(1,1,2)=-1 |
M(1,2,2)=-4 |
A3 (2,1) |
M(2,1,1)=5 |
M(2,2,1)=2 |
M(2,2,1)=2 |
M(2,1,1)=5 |
A4 (2,2) |
M(2,1,2)=2 |
M(2,2,2)=6 |
M(2,2,2)=6 |
M(2,1,2)=2 |
Отримана гра не має сідлової точки. Розв’язуючи гру в мішаних стратеґіях, отримаємо мішані стратеґії 1-го гравця — (0,0,4/7,3/7), 2-го гравця — (4/7,3/7,0,0), та ціна гри становитиме v=26/7. Таким чином, в загальному випадку втрата інформації зменшує ціну гри.
