Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный транспортный университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Оптимізаційны методи та моделі.doc

Скачиваний:

Добавлен:

01.07.2025

Размер:

5.7 Mб

Скачать

☆

<<< < Предыдущая 14 15 16 17 18 19 20 21 22 23 24 2526 / 4526 27 28 29 30 31 32 33 34 35 36 37 38 > Следующая >>>

6.3. Аналіз матричних ігр

Нижня і верхня ціни гри. Принцип мінімаксу

Розглянемо скінчену гру гравців А і В. Гравець А має m стратегій, гравець В-n стратегій. Стратегії першого гравця: А₁, А₂, ..., А_m, стратегії другого гравця: В₁, В₂, ..., В_n.Нехай відомі виграші для кожної пари стратегій. Складемо матрицю гри або платіжну матрицю (табл. 6.2). Поставимо собі задачу: визначити свою оптимальну стратегію.

Обираючи стратегію А_і, ми завжди повинні розраховувати на те, що противник відповість на її тією з стратегій В_j, для якої ваш виграш мінімальний.

Таблиця 6.2

Гравець А	Гравець В
Гравець А	В₁	….	В_j	….	B_n
А₁	а₁₁	….	a_1j	….	a_1n
….	….	….	….	….	….
А_і	а_і1	….	a_ij	….	a_in
….	….	….	….	….	….
А_m	а_mі	….	a_mj	….	a_mn

Визначимо це значення виграшу, тобто мінімальне з чисел в і-тому рядку. Позначивши його через , отримаємо:

Випишемо числа поруч з матрицею праворуч у вигляді додаткового стовпця (табл. 6.3)

Таблиця 6.3

B A	B₁	B₂	…..	B_n	_i
A₁	A₁₁	a₁₂	…..	a_1n	₁
A₂	A₂₁	a₂₂	…..	a_2n	₂
…..	…..	…..	…..	…..	…..
A_m	a_m1	a_m2	…..	a_mn	_m
	₁	₂	…..	_n

Очевидно, першому гравцю найкраще вибрати таку стратегію, яка дає найбільшу величину . Позначимо

Отримана величина називається нижньою ціною гри або максиміном. Стратегія, що відповідає цій величині, називається максимінною стратегією.

Нижня ціна гри означає той максимальний виграш, який ми можемо гарантувати в грі проти розумного противника, обираючи одну з своїх стратегій.

Очевидно, аналогічне міркування можна провести і за противника (гравця В). Він зацікавлений в тому, щоб обернути виграш в мінімум. Якщо гравець В обере якусь j-ту стратегію, то гравець А відповість такою і-ю стратегією, яка зробить виграш максимальним. Позначимо виграш ₀—це максимальне значення, яке відповідає j-тій стратегії. Знизу матриці визначимо максимальні значення а_іj по кожному стовпцю:

Ясно, що сторона В обере таку стратегію, яка веде цей програш до мінімуму. Позначимо:

Величина називається верхньою ціною гри або мінімаксом, а відповідна їй стратегія — мінімаксною.

Верхня ціна гри — це мінімальний програш, на який може розраховувати «противник», який вибравши одну а своїх стратегій, розраховуючи на найгіршу для себе нашу поведінку.

Додержуючись своєї найбільш обережної мінімаксної стратегії, противник гарантує собі слідуюче: щоб ми не здійснили проти нього, він у всякому разі програє суму, яка не перебільшує .

Принцип, який потребує від обох гравців вибору відповідно максимінної і мінімаксної стратегій, називається принципом мінімакса.

Якщо = , то гра має так звану сідлову точку. Сідловій точці відповідає пара стратегій, які називаються оптимальним, а їх сукупність — розв’язком гри.

Чиста ціна гри: = = .

Приклад: Організується захист малорозмірного об’єкту: можливі 4 варіанти оборони А₁, А₂, А₃, А₄. Супротивник може застосовувати 4 варіанти нападу В₁, В₂, В₃,В₄. Відома платіжна матриця, в якій вказується відсоток знешкодженних засобів супротивника із загального числа при будь-якій стратегії. Необхідно вибрати такий варіант оборони, щоб забезпечити максимальне число знешкоджених засобів супротивника. Платіжна матриця задана табл. 6.4.

Таблиця 6.4

Варіанти захисту	Варіанти нападу				_i
Варіанти захисту	В₁	В₂	В₃	В₄
А₁	50	60	90	40	40
А₂	90	50	40	80	40
А₃	80	70	90	90	70*
А₄	80	30	50	70	30
_j	90	70*	90	90	=

Тут . Оптимальними («чистими») стратегіями є стратегії А₃ і В_2.

Розв’язок гри має наступну чудову властивість: у грі з сідловкою точкою відхилення від оптимальної стратегії не вигідне ні одному а гравців. Тому така гра стійка.

Якщо який-небудь гравець буде намагатися відхилися від своєї оптимальної лінії поведінки, то він цього лише програє. Якщо сідлова точка у грі відсутня,то розв’язок гри лежить в області замішаних стратегій.

Основна теорема теорії гри була доведена в 1928 р. Фон Нейманом. Вона стверджує, що кожна кінцева гра має, у крайньому разі, один вариант розв’язку (хоча б у класі змішаних стратегій).

Причому ціна гри завжди лежить між нижньою і верхньою ціною гри: .

Розглянемо гру 2 2,в якій відома платіжна матриця (табл. 6.5):

Таблиця 6.5

В А	q	1-q	_i
Р	3	6	3
1-р	5	4	4*
_i	5*	6	≠

Аналізуючи матрицю, знаходимо нижню і верхню ціну гри:

=4, =5.

Тут ≠ , отже сідлової точки немає. Отже, шукаємо розв’язок в області змішаних стратегій. Гравець А повинен прийняти свою змішану стратегію S_A,гравець В-стратегію S_B:

_{,

.}

Знайдемо середній виграш:

_{M[а]=3pq + 6p(1 – q)
+ 5(1 – p)q + 4(1 – p) (1 – q).}

Розв’язати гру з позиції гравця А — це означає знайти таке значення імовірності Р, яке забезпечить максимальне значення М[а] при будь-яких значеннях q, тобто при будь-яких діях гравця В, який намагається зменшити це значення. Формально це можна записати та

_{{max
min М [а]} max}

_{p q}

Після деяких алгебраїчних перетворень у виразі для М[а], отримаємо:

_{M[а]= −4(p – 1/4)
(q – 1/2) + 4,5.}

Аналізуючи цей вираз, приходимо до висновку, що якщо Р=1/4, то при будь-яких q значення середнього виграшу лишається рівним 4,5. Тому оптимальними стратегіями гравців А і В є стратегії:

_{,
S*B =

.}

ЗАГАЛЬНЕ ОЗНАЧЕННЯ: в грі m x n змішана стратегія гравця А

Є ОПТИМАЛЬНОЮ, якщо вона забезпечує максимальне значення середнього виграшу при будь-яких діях гравця В, який намагається зменшити цей виграш, тобто це та стратегія, яка відповідає:

_{aij
pi qj.}

Для гравця В оптимальною стратегією буде та, яка відповідає:

_{aij
pi qj.}

В теорії гри доведено, що

Це значення називають ЦІНОЮ ГРИ:

Введемо поняття корисної стратегії. КОРИСНА СТРАТЕГІЯ — це стратегія, імовірність якої в оптимальній змішаній стратегії не дорівнює нулю.

<<< < Предыдущая 14 15 16 17 18 19 20 21 22 23 24 2526 / 4526 27 28 29 30 31 32 33 34 35 36 37 38 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
29.02.20162.41 Mб1266Объемы масла для вилок Rock Shox.pdf
#
01.03.2025219.65 Кб1ОДСС.doc
#
01.03.202592.43 Кб0озед 28-34.docx
#
17.11.2019539.14 Кб3оНОЙКО.doc
#
28.02.2016130.56 Кб7Описи предметних областей.doc
#
01.07.20255.7 Mб8Оптимізаційны методи та моделі.doc
#
01.07.2025124.6 Кб1Ораторське.docx
#
01.05.2025471.55 Кб1організаційні зміни.doc
#
01.07.20251.18 Mб1Організація підприємства.docx
#
26.08.2019164.25 Кб5Організація та функції обслуговування робочих м...docx
#
01.07.2025715.26 Кб0Осипенко А.А..doc