- •Матрична гра двох осіб
- •П II латіжна матриця
- •Принцип мінімакса і максиміна
- •Спрощення гри
- •Підходи до розв’язку задач ігор із природою, основані на застосуванні суб’єктивно назначених ймовірностей станів природи.
- •Інші підходи до знаходження оптимального розв’язку в умовах повної невизначеності, засновані на застосуванні інших критеріїв.
- •Приклад 1.
- •Задача для самостійного розв’язання.
Підходи до розв’язку задач ігор із природою, основані на застосуванні суб’єктивно назначених ймовірностей станів природи.
Якщо об’єктивні оцінки станів одержати неможливо, то ймовірності станів природи можуть бути оцінені суб’єктивно на основі:
принципу недостатнього обґрунтування Лапласа
Стани
природи уявляються однаково правдоподібними,
і їх ймовірності приймаються рівним
між собою
.
Оптимальна стратегія за критерієм Лапласа:
спадної арифметичної професії
де
Цей прийом застосовується, якщо можна розташувати стани природи в порядку зменшення їх правдоподібності (ймовірності здійснення);
одержання середніх значень ймовірностей станів
за допомогою оцінок експертів.
Інші підходи до знаходження оптимального розв’язку в умовах повної невизначеності, засновані на застосуванні інших критеріїв.
Максиміний критерій Вальда (критерій крайнього песимізму). В якості оптимальної рекомендується вибирати ту стратегію, яка гарантує в найгірших умовах максимальний виграш, тобто максимінну стратегію:
Критерій Севіджа (мінімаксного ризику). Цей критерій, так само як і критерій Вальда, є критерієм крайнього песимізму. Згідно із цим критерієм, рекомендується вибирати ту стратегію, при якій у найгірших умовах величина ризику приймає найменше значення:
Критерій Гурвіца (критерій узагальненого максимуму або песимізму-оптимізму). Він має вигляд
Очевидно,
що при
критерій Гурвіца перетворюється в
песимістичний критерій Вальда, а при
– у критерій крайнього оптимізму.
Коефіцієнт
вибирається на підставі суб’єктивних
міркувань (досвіду, здорового глузду і
т.д.).
Використовуючи матрицю ризиків R критерій Гурвіца має вигляд:
При
критерій Гурвіца перетворюється у
критерій крайнього оптимізму, а при
– в песимістичний критерій Севіджа.
Зауваження. У моделях гри з природою за умови невизначеності її можливих станів доцільно обирати оптимальну стратегію, використовуючи усі три вищеназвані критерії. Якщо при використанні усіх критеріїв оптимальні стратегії тотожні, то це переконлива аргументація для практичного використання результату. Якщо розв’язки не співпадають, необхідно ретельно проаналізувати результати та використати один із них.
Приклад 1.
Сільськогосподарське підприємство планує вирощувати деяку культуру на одній з ділянок землі. На врожайність культури впливають погодні умови й кількість внесених добрив. Літо може бути сухе – П1, нормальне (із середньою кількістю опадів) – П2 і вологе – П3. Сільськогосподарське підприємство може внести на 1 га кількість добрив, відповідно до норми А1, більше норми – А2 і менше норми – А3 Потрібно визначити, яку кількість добрив внести на 1 га посіву, щоб дістати найбільший прибуток при самих несприятливих погодних умовах. Підприємство розрахувало прибуток залежно від погодних умов і можливих своїх стратегій по внесенню добрив. Усі дані розрахунків (тис. грошових. од.) наведені в таблиці.
|
П1 |
П2 |
П3 |
А1 |
45 |
50 |
46 |
А2 |
42 |
52 |
44 |
А3 |
46 |
47 |
50 |
А4 |
45 |
47 |
48 |
Врахувати такі додаткові умови:
Відомі ймовірнісні характеристики погодних умов: ймовірність випадіння опадів менше норми
;
ймовірність випадіння опадів у нормі
;
ймовірність випадіння опадів більше
норми
.Ймовірнісні характеристики погодних умов суб’єктивно назначені
ймовірності станів природи рівні між собою .
стратегії природи в порядку зменшення ймовірності її станів утворюють ряд:
Знайти розв’язок гри за критеріями Вальда, Севіджа, Гурвіца при
.
Проаналізувати всі отримані варіанти розв’язків гри та зробити висновки про оптимальну стратегію.
Розв’язання
Аналіз матриці виграшів гри з природою та побудова матриці ризиків
Виконаємо спрощення платіжної матриці.
Аналіз платіжної матриці показує, що елементи стратегії А4 менші за відповідні елементи А3, отже стратегія А4 є свідомо невигідною і ми можемо виключити її.
Стосовно стратегій природи, то жодну з них відкидати не можна, так як кожен зі станів природи може настати випадковим чином, незалежно від дій гравця А. Хоча аналіз і показав, що всі елементи стратегії П1 менші за елементи стратегії П2.
В результаті отримаємо матрицю
|
П1 |
П2 |
П3 |
А1 |
45 |
50 |
46 |
А2 |
42 |
52 |
44 |
А3 |
46 |
47 |
50 |
Виконаємо перерахунок матриці виграшів у матрицю ризиків.
Розрахуємо елементи матриці ризиків
;
;
;
;
;
;
;
;
;
В результаті отримаємо матрицю ризиків
|
П1 |
П2 |
П3 |
А1 |
1 |
2 |
4 |
А2 |
4 |
0 |
6 |
А3 |
0 |
5 |
0 |
Знайдемо розв’язок гри, якщо відомі ймовірності станів природи.
Середні значення виграшів для кожної зі стратегій гравця А:
Максимальне середнє значення виграшу:
.
Отже, оптимальною стратегією, згідно з розв’язком задачі, є стратегія А3.
Розв’язок цієї задачі за критерієм ризику дає такий же результат:
;
;
.
.
Знайдемо розв’язок гри, якщо ймовірності станів природи є рівними, використовуючи принцип недостатнього обґрунтування Лапласа.
Максимальне середнє значення виграшу:
.
Отже, оптимальною стратегією, згідно з розв’язком задачі, є стратегія А3.
Знайдемо розв’язок гри з природою, якщо відомо, що стратегії природи в порядку зменшення ймовірності її станів утворюють ряд: .
Розрахуємо
ймовірність q3
стану природи П3,
оскільки вона має ранг 1, тобто
,
при
і т.д.
Середні
виграші
;
;
.
Максимальне значення
.
Отже, оптимальною є стратегія А3.
Знайдемо розв’язок гри за критеріями Вальда, Севіджа і Гурвіца при .
Критерій Вальда. Розрахуємо елементи
,
і запишемо їх у додатковий
стовбець платіжної матриці.
|
П1 |
П2 |
П3 |
|
А1 |
45 |
50 |
46 |
45 |
А2 |
42 |
52 |
44 |
42 |
А3 |
46 |
47 |
50 |
46 |
Максимальна
з величин
співпадає з
,
отже, оптимальною є стратегія А3.
Критерій Севіджа. Розрахуємо елементи
,
і запишемо їх у додатковий стовбець
матриці
ризиків.
|
П1 |
П2 |
П3 |
|
А1 |
1 |
2 |
4 |
4 |
А2 |
4 |
0 |
6 |
6 |
А3 |
0 |
5 |
0 |
5 |
Мінімальна
з величин
співпадає з
,
отже, оптимальною є стратегія А1.
Критерій Гурвіца. В додаткових стовбцях платіжної матриці запишемо оцінки:
|
П1 |
П2 |
П3 |
|
|
|
А1 |
45 |
50 |
46 |
45 |
50 |
47,0 |
А2 |
42 |
52 |
44 |
42 |
52 |
46,0 |
А3 |
46 |
47 |
50 |
46 |
50 |
47,6 |
Максимальна
з величин
співпадає з
,
отже, оптимальною є стратегія А3.
Висновок. Критерії Вальда і Гурвіца вказують на стратегію А3, яку можна вважати оптимальною для заданих умов.
