
- •Тема 5. Методи розв’язування задач теорії ігор
- •5.1. Основні поняття теорії ігор
- •5.2. Матричні ігри двох осіб з нульовою сумою. Матриця гри. Верхня та нижня ціна гри. Теорема про мінімакс
- •5.3. Змішані стратегії в іграх двох осіб з нульовою сумою
- •5.4. Представлення гри у вигляді задач лінійного програмування.
- •5.5. Ігри порядку 2 2, 2 n та m 2. Графічне розв’язування ігор.
- •5.6. Прийняття рішень в умовах невизначеності
- •Контрольні запитання
5.6. Прийняття рішень в умовах невизначеності
Задачі прийняття рішень в умовах невизначеності близькі за ідеями та методами до теорії ігор, основною відмінністю є відсутність конфліктного забарвлення — ніхто нікому не протидіє, але наявний елемент невизначеності.
Таким чином невідомі умови операції залежать не від свідомого суперника, а від об’єктивної реальності — “природи”, яка є байдужою інстанцією. Поведінка природи невідома але не протидіюча. Зовнішньо при наявності стратегій гравця та природи гра з природою представляється матрицею, але відсутність протидії робить ситуацію якісно іншою.
Найпростішим випадком є такий, коли одна зі стратеґій гравця А домінує всі інші його стратеґії — зрозуміло, що вона буде найкращою. Але не природи — гравця П (йому все одно, яку стратеґію обирати). Таким чином, вибір можна звузити, виключивши з розгляду всі доміновані та еквівалентні стратеґії.
Окрім
того, бажано ввести такі показники, які
б не просто давали виграш при даній
стратеґії в кожній ситуації, але й
відображали б “вдалість” або “невдалість”
вибору тієї чи іншої стратеґії в
конкретній ситуації. З цією метою
вводиться поняття ризику, як різницею
між виграшем, який можна було б отримати,
якщо б ми знали умови природи — її
стратеґію Пj, та виграшем, який
ми отримаємо, не знаючи їх та обираючи
стратегію Аі,
,
де
.
Приклад 7. Задана матриця гри з природою. Необхідно побудувати матрицю ризиків та обрати найкращу стратеґію.
Матриця ризиків буде
Розглядаючи матрицю “ризиків”, зрозумілішими стають деякі риси гри з природою. Так, в другому рядку перший та останній елементи матриці виграшів рівні 3. Однак ці виграші нерівноцінні в сенсі вдалого вибору стратеґії: при стані природи П1 ми могли виграти найбільш 4 одиниці, і вибір А2 для цієї ситуації майже добрий. За умови стану П4 природи натомість ми могли б, обравши А1, отримати на 6 одиниць більше, тобто вибір А2 для цієї ситуації є поганим. Ризик — це по суті плата за відсутність інформації, і тому, звичайно, бажано би було мінімізувати ризик, що супроводжує вибір рішення. Таким чином, маємо 2 постановки задачі — в одній необхідно отримати максимальний виграш, а в іншій — мінімізувати ризик.
Найпростішим
випадком невизначеності є “доброякісна”
стохастична невизначеність. В цьому
випадку стани природи характеризуються
ймовірностями їх виникнення
,
і оптимальною стратеґією Аk буде
та, для якої
(критерій
.
Відповідний критерій для ризику у
випадку стохастичної невизначеності
.
Для прикладу якщо р=(0.5, 0.2, 0.2, 0.1), то
Q(A1)=0.5*1+0.2*4+0.2*5+0.1*9=3.2,
Q(A2)=0.5*3+0.2*8+0.2*4+0.1*3=4.2,
Q(A3)=0.5*4+0.2*6+0.2*6+0.1*2=3.6, і оптимальною
буде стратеґія А2.
Нехай тепер ймовірності природи існують, але невідомі нам.
Згідно до критерію Лапласа всі стани природи вважаються рівноймовірними. Однак застосовувати його в більшості випадків не рекомендується, оскільки а багатьох випадках апріорі більш-менш відомо, як відрізняються ймовірності. В цьому випадку, якщо є можливість, необхідно провести експертне опитування, абож спробувати накопичити інформацію в результаті проведення декількох ігор з природою. Згідно до критерію Лапласа в прикладі рівноцінними є стратеґії А1 та А2.
Якщо ж невизначеність “погана”, якщо ймовірностей природи взагалі не існує, або ж вони не піддаються навіть приблизній оцінці, то в залежності від позиції дослідника застосовуються наступні критерії.
Максимінний
критерій Вальда В. Згідно до цього
критерія гра з природою ведеться як гра
з аґресивним та розумним суперником, і
обирається стратеґія з індексом k, для
якої
.
Це є позиція скрайнього песимізму, і по
відношенню до природи є перестраховочною.
Критерій
мінімального ризику Севіджа С. Цей
критерій є теж вкрай песимістичним, але
при виборі оптимальної стратеґії
орієнтує на мінімальний ризик. В якості
оптимальної стратеґії обирається така
з індексом k, для якої величина ризику
в найгірших умовах мінімальна —
.
Критерій
песимізму-оптимізму Гурвіца H. Цей
критерій рекомендує при виборі розв’язку
не орієнтуватися ні на песимізм, ані на
оптимізм, і має вигляд
,
де
— коефіцієнт песимізму, коли рівний 1
— Гурвіца, 0 — скрайнього оптимізму .
Приклад 8. Нехай задана матриця гри з природою. Здійснимо вибір за декількома критеріями.
|
П1 |
П2 |
П3 |
П4 |
Min |
Max |
|
А1 |
19 |
30 |
41 |
49 |
19 |
49 |
31 |
А2 |
51 |
38 |
10 |
20 |
10 |
51 |
26 |
А3 |
73 |
18 |
81 |
11 |
11 |
81 |
38 |
|
73 |
38 |
81 |
11 |
19 |
81 |
38 |
Матриця ризиків
|
П1 |
П2 |
П3 |
П4 |
Min |
А1 |
54 |
8 |
40 |
0 |
54 |
А2 |
22 |
0 |
71 |
29 |
71 |
А3 |
0 |
20 |
0 |
38 |
38 |
Таким чином за критерієм Вальда обираємо стратеґію А1, Гурвіца з 0.6 — А3, Севіджа — А3.