Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Шпора ЕММ 2003.doc
Скачиваний:
6
Добавлен:
18.04.2019
Размер:
1.95 Mб
Скачать

39. Методи розв’язування задач динамічного програмування. Основні кроки алгоритму розв’язування задачі динамічного програмування.

Для того, щоб можна було застосувати метод динамічного програмування, необхідне дотримання трьох умов:

1) всі розв’язки підзадач мають запам’ятовуватися у таблиці;

2) задачу можна розбити на підзадачі аналогічної структури, але меншої розмірності, тобто такі, у яких значення хоча б одного параметра буде менше;

3) мають існувати і бути відомими (очевидними) розв’язки для задач з малою розмірністю. Знаходження розвязку конкретних задач методами ДП включають декілька етапів чи кроків, на кожному з яких визначається розвязок деякої окремої задачі, обумовленою початковою.

Типовий алгоритм розв’язування задачі методом динамічного програмування є таким:

1) описати структуру оптимальних відношень;

2) записати рекурентне відношення, що пов’язує оптимальні значення параметра для підзадач;

3) рухаючись знизу вгору, обчислити оптимальні значення параметра для підзадач;

4) користуючись одержаною інформацією, побудувати оптимальне розв’язання.

Процес покрокового рішення задачі зводиться в основному до покрокового заповнення таблиць, коли на кожному кроці вибирається одне рішення з множини допустимих на цьому кроці, причому таке, що оптимізує задану цільову функцію або функцію критерія.

40. Основні поняття теорії ігор. Гра двох гравців з нульовою сумою, правила гри, ціна гри, пара оптимальних стратегій для двох осіб.

Теорія ігор — це математичний апарат, що розглядає конфліктні ситуації, а також ситуації спільних дій кількох учасників. Завдання теорії ігор полягає у розробленні рекомендацій щодо раціональної поведінки учасників гри.

Якщо спочатку розвивався аналіз ігор, в яких один із супротивників виграє за рахунок інших (ігри з нульовою сумою), то згодом почали розглядати широкий клас взаємодій, які були класифіковані за певними критеріями. На сьогоднішній день «теорія ігор щось на кшталт парасольки чи універсальної теорії для раціональної сторони соціальних наук, де соціальні можемо розуміти широко, включаючи як людських так не-людських гравців (комп’ютери, тварини, рослини)» (Роберт Ауманн, 1987).

Логічною основою теорії ігор є формалізація трьох понять, які входять в її визначення і є фундаментальними для всієї теорії:

Конфлікт,

Прийняття рішення в конфлікті,

Оптимальність прийнятого рішення.

Ці поняття розглядаються в теорії ігор у найширшому сенсі. Їх формалізації відповідають змістовним уявленням про відповідні об'єкти.

Змістовно, конфліктом можна вважати будь-яке явище, відносно якого можна казати про його учасників, про їхні дії, про результати явищ, до яких призводять ці дії, про сторони, які так чи інакше зацікавлені в таких наслідках, і про сутність цієї зацікавленості.

Якщо назвати учасників конфлікту коаліціями дії (позначивши їхню множину як ℜD, можливі дії кожної із коаліції дії — її стратегіями (множина всіх стратегій коаліції дії K позначається як S), результати конфлікту — ситуаціями (множина всіх ситуацій позначається як S; вважається, що кожна ситуація складається внаслідок вибору кожної із коаліцій дії деякої своєї стратегії, так, що ), зацікавлені сторони — коаліціями інтересів (їх множина — ℜI) і, нарешті, говорити про можливі переваги для кожної коаліції інтересів K однієї ситуації s′ перед іншою s″ (цей факт позначається як ), то конфлікт в цілому може бути описаний як система

Така система, яка представляє конфлікт, називається грою. Конкретизації складових, які задають гру, призводять до різноманітних класів ігор.

І́гри антагоністи́чні — ігри з двома гравцями які мають прямо протилежні інтереси. Формально, ця протилежність (антагоністичність), виявляється в тому, що при переході від однієї ситуації до іншої збільшення (зменшення) виграшу одного гравця, тягне за собою зменшення (збільшення) виграшу іншого. Таким чином, сума виграшів гравців в будь-якій ситуації в антагоністичних іграх стала (як правило, можна вважати, що вона дорівнює нулю). Тому, антагоністичні ігри називають, також, іграми двох осіб з нульовою сумою (іноді — нульовими іграми). Антагоністичні ігри в нормальній формі задають системою Γ = <A, B, H>, де A, B — множини стратегій першого та другого гравців відповідно, H — функція з дійсними значеннями, визначена на всій множині ситуацій A × B, яка є функцією виграшу першого гравця (за визначенням, функція виграшу другого гравця дорівнює − H). Процес розігрування антагоністичних ігор полягає в виборі гравцями деяких своїх стратегій a ∈ A, b ∈ B, після чого перший гравець отримує від другого суму H(a, b).

Розумна поведінка гравців в антагоністичних іграх відбувається на основі принципу максіміна. Якщо (1)

Тоді в кожного гравця існують оптимальні стратегії, тобто, стратегії, на яких досягаються в (1) зовнішні екстремуми. Однак, навіть в найпростіших випадках рівність (1) може не мати місця. Наприклад, в матричній грі з матрицею виявляється Для того, щоб забезпечити реалізованість принципу максіміна, множини стратегій гравців розширюють розширюють до множини змішаних стратегій, які полягають в випадковому виборі гравцями своїх початкових стратегій, які називаються чистими, а функція виграшу визначається як математичне очікування виграшу в умовах застосування змішаних стратегій. В наведеному прикладі оптимальними змішаними стратегіями гравців є вибори гравцями обох своїх стратегій з ймовірностями 1/2, а значення гри дорівнює нулю.

Якщо множини A та B скінченні, то антагоністична гра називається матричною грою; для неї завжди існують оптимальні змішані стратегії у обох гравців. Якщо ж одна із множин A або B нескінченне, то антагоністична гра називається нескінченною.

Принцип максіміна для нескінченних антагоністичних ігор може здійснюватись (якщо рівність (1) не має місця) у вигляді рівності: В такому випадку оптимальною стратегією для гравців не існує, однак для будь якого ε > 0 існують ε-оптимальні стратегії (тобто, стратегії, які забезпечують досягнення значення гри з заданою точністю ε) у обох гравців.

Якщо обидві множини A та B нескінченні, то оптимальні змішані стратегії (і навіть ε-оптимальні) не завжди існують. Наприклад, в грі з функцією виграшу де стратегіями гравців є множини натуральних чисел.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]