Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ММДО.DO_ukr_new.doc
Скачиваний:
164
Добавлен:
16.05.2015
Размер:
5.09 Mб
Скачать

1.6 Формалізація принципів оптимального поводження в моделях прийняття рішення.

Під принципом оптимальності розуміється така сукупність правил, за допомогою яких ОПР визначає свою дію (рішення, альтернативу, стратегію, управлінське рішення), і яка щонайкраще сприяє досягненню поставленої ним мети. Принцип оптимальності вибирається виходячи з урахуванням конкретних умов прийняття рішення: кількості учасників, їх можливостей і цілей, характеру зіткнення інтересів (антагонізм, не антагонізм, кооперація і т.п.).

В моделях прийняття рішення, особливо в теорії ігор, розроблено багато формальних принципів оптимального поводження. Тут ми зупинимося лише на деяких з них.

Принцип максимізації (мінімізації). Такий принцип застосовується, в основному, у задачах математичного програмування (див. підрозділи (1.2) - (1.4)).

Принцип згортки критеріїв. Застосовується при "оптимізації багатьох критеріїв одним координуючим центром (задача багатокритеріальної оптимізації (1.5)). Для кожного з критеріїв (цільових функцій) f1(u),...,fn(u) експертним шляхом призначаються "ваги" (числа) ,причому αi показує "важливість або значимість" критерію f. Далі розв’язок x* з множини допустимих рішень Х вибирається такий, щоб максимізувати (чи мінімізувати) згортку критеріїв

Принцип лексикографічної переваги.Це ще один принцип оптимальності в задачах багатокритеріальної оптимізації. Спочатку критерії ранжуються по "важливості". Нехай така ранжування складено

f1(x), f2(x),...,fn(x).

Розв’язок х*Х буде "краще" розв’язку хХ у сенсі лексикографічної переваги, якщо виконується одна з n+1 умов:

  1. f1(x*) > f1(x);

  2. f1(x*) = f1(x), f2(x*) > f2(x);

  3. f1(x*) = f1(x), f2(x*) = f2(x), f3(x*) > f3(x);

……………….................................................

  1. fi(x*) = fi(x) для i = 1,…, n-1, fn(x*) > fn(x);

n+1) fi(x*) = fi(x) для i = 1,…,n...

Принцип мінімаксу.Застосовується при зіткненні інтересів двох антагоністичних сторін (антагоністичний конфлікт). Кожна ОПР спочатку для кожної своєї стратегії (альтернативи) обчислює "гарантований" результат, потім остаточно вибирає ту стратегію, за якою цей результат найбільший у порівнянні з іншими його стратегіями. Така дія не дає ОПР "максимального виграшу", однак є єдиним розумним принципом оптимальності в умовах антагоністичного конфлікту. Зокрема, виключається будь-кий ризик.

Принцип рівноваги. Це узагальнення принципу мінімаксу, коли у взаємодії беруть участь багато сторін, кожна з яких переслідує свою мету (прямого протистояння немає). Нехай число ОПР (учасників неантагоністичного конфлікту) є n. Набір обраних стратегій (ситуація) x1*, x2*,…,xn* називається рівноважним, якщо однобічне відхилення будь-якої ОПР від цієї ситуації може призвести хіба лише до зменшення його ж "виграшу". У ситуації рівноваги учасники не отримують “максимального” виграшу, але вони змушені дотримуватись її.

Принцип оптимальності по Парето. Даний принцип припускає в якості оптимальних ті ситуації (набори стратегій х1,…,xn), у який поліпшення “виграшу” окремого учасника неможливе без погіршення “виграшів” інших учасників. Цей принцип висуває слабкіші вимоги до поняття оптимальності, ніж принцип рівноваги. Тому Парето-оптимальні ситуації існують майже завжди.

Принцип не домінуючих результатів. Цей принцип є представником багатьох принципів оптимальності в кооперативних іграх (колективне прийняття рішень) і приводить до поняття "ядра" рішень. Всі учасники поєднуються і спільними погодженими діями максимізують “загальний виграш”. Принцип не домінуючих результатів – один із принципів “справед­ливого” розподілу між учасниками. Це та ситуація, коли жоден з учасників не може аргументовано заперечити проти запропонованого розподілу (елемента "ядра"). Існують й інші принципи оптимального розподілу загального сумарного виграшу.

Принципи стійкості (погрози і контропогрози).Ідея всіх принципів стійкості на основі погроз і контропогроз полягає у такому. Кожна коаліція учасників висуває свою пропозицію, супроводжуючи його реальною погрозою: якщо пропозиція не буде прийнято іншими учасниками, то будуть початі такі дії, що погіршують положення інших учасників і не погіршують (можливо поліпшують) положення загрозливої коаліції. Оптимальним вважається те рішення, в умовах якого проти будь-якої погрози будь-якої коаліції знайдеться контрпогроза з боку якоїсь коаліції.

Арбітражні схеми.Економічні конфлікти наводять на думку про арбітраж. Небажано щоб зіткнення інтересів переходили, наприклад, у відкриті погрози і контрпогрози. Повинні існувати соціальні механізми, що дозволяли б враховувати переваги і стратегічні можливості кожного учасника і забезпечили б “справедливе” розв’язання конфлікту. Такий механізм, будь то окрема особа або система голосування, називається арбітром.

У теорії ігор оптимальне, у сенсі арбітражної схеми, рішення будується за системою аксіом, що включають такі поняття, як статус-кво, оптимальність по Парето, лінійність альтернатив, незалежність від рангів тощо.

Далі розглянемо питання оптимального прийняття рішення в умовах невизначеності. Для визначення оптимального поводження ОПР таку ситуацію корисно моделювати, як антагоністичну гру двох осіб, де супротивником ОПР розглядається природа. Остання наділяється всіма мислими­ми в даних умовах можливостями. В іграх з природою існують свої специфічні (хоча і нагадують принципі мінімаксу) принципи оптимального вибору рішення.

Принцип крайнього песимізму (критерій Вальда). Відповідно до цього принципу гра з природою (прийняття рішення в умовах невизначеності) ведеться як гра з розумним і агресивним супротивником, що робить усе для того, щоб перешкодити нам досягти успіху. Оптимальною вважається стратегія ОПР, за якою гарантується виграш, не менший, ніж дозволений природою.

Принцип мінімаксного ризику (критерій Сэвиджа). Цей принцип також песимістичний, але при виборі оптимальної стратегії радить орієнтуватися не на виграш, а на ризик. Ризик визначається як різниця між максимальним виграшем особи, що приймає рішення, за умови повної інформації про стан природи і реальним її виграшем за умови відсутності цієї інформації. Як оптимальна вибирається та стратегія, за якою ризик буде мінімальним.

Принцип песимізму - оптимізму (критерії Гурвица).Цей критерій рекомендує при виборі рішення не керуватися ні крайнім песимізмом (завжди розраховуй на гірше), ні крайнім оптимізмом (“либонь крива вивезе”). Відповідно цьому критерію максимізується зважене середнє між виграшами крайнього песимізму і крайнього оптимізму. Причому «вага» вибирається із суб'єктивних розумінь про небезпеку ситуацій.

Концепція динамічної стійкості. Усі викладені вище принципи оптимальності сформульовані щодо статичних задач прийняття рішення. Спроба застосування їх у динамічних задачах може призвести всілякими ускладненнями. Головне - це особливості динамічних процесів. Потрібно, щоб той або інший принцип оптимальності, що був обраний на початку процесу (у початковий момент часу), залишався оптимальним у будь-якому поточному стані (у будь-який момент часу) до кінця динамічного процесу. Цей принцип називається динамічною стійкістю.