
- •Министерство образования российской федерации
- •Содержание
- •Глава I. Основные понятия и определения 4
- •Глава I. Основные понятия и определения.
- •1.1. Принятие решений как вид человеческой деятельности.
- •1.2. Математические модели принятия решений.
- •ГлаваIi. Математические модели оптимизации ресурсов и принятия решений.
- •2.1. Общий случай математической постановки задачи оптимизации.
- •2.2. Методы оптимизации и распределения ресурсов на основе задач линейного программирования.
- •2.3. Методы многопараметрической оптимизации в процессах планирования, управления и принятия решений.
- •2.4. Задачи линейного программирования в оперативном управлении производством и принятии решений.
- •Понятие о двойственности решений.
- •Вопросы для самоконтроля по главе
- •Тест по главе
- •Глава III .Задачи нелинейного программирования в процессе оптимизации ресурсов и принятия решений.
- •3.1. Аналитические методы решения задач безусловной оптимизации.
- •3.2. Задачи условной оптимизации и методы их решений.
- •Вопросы для самоконтроля по главе
- •Тест по главе
- •Глава IV. Теоретико-игровые модели принятия решения.
- •4.1. Матричные игры.
- •4.2. Позиционные игры.
- •4.3. Биматричные игры.
- •Вопросы для самоконтроля по главе
- •Глава V. Исследование операций.
- •5.1. Динамическое программирование
- •Постановка задачи
- •5.2. Элементы теории управления запасами.
- •5.3. Теория массового обслуживания.
- •Вопросы для самоконтроля по главе
- •Вопросы для самопроверки
- •Словарь основных понятий
- •Литература
- •Ответы к текстам
- •Для замечаний
4.3. Биматричные игры.
Предыдущие рассмотрения касались игр двух лиц, в которых интересы игроков были прямо противоположны, а также позиционных игр, сводимых к матричным. Однако ситуации, в которых интересы игроков хотя и не совпадают, но уже не обязательно являются противоположными, встречаются значительно чаще.
Рассмотрим, например, конфликтную ситуацию, в которой каждый из двух участников имеет следующие возможности для выбора своей линии поведения:
игрок А – может выбрать любую из стратегий А1,…,Аm,
игрок В – любую из стратегий В1,…,Вn.
При этом их совместный выбор оценивается вполне определённо: если игрок А выбрал i-ю стратегию Аi, а игрок В – k-ю стратегию Вk, то в итоге выигрыш игрока А будет равен некоторому числу aik, а выигрыш игрока В некоторому, вообще говоря, другому числу bik.
Последовательно
перебирая все стратегии игрока А и все
стратегии игрока В, мы сможем заполнить
их выигрышами две таблицы
Первая из таблиц
описывает выигрыш игрока А, а вторая –
выигрыш игрока В. Обычно эти таблицы
записывают в виде матрицы
А = , В =
Здесь А – платёжная матрица игрока А,
В – платёжная матрица игрока В.
Таким образом, в случае, когда интересы игроков различны (но не обязательно противоположны) получаются две платёжные матрицы: одна – матрица выплат игроку А, другая – матрица выплат игроку В. Поэтому совершенно естественно звучит название, которое обычно присваивается подобной игре – биматричная.
Пример1: «Студент – Преподаватель».
Студент (игрок А) готовится к зачету, который принимает Преподаватель (игрок В). Можно считать, что у студента две стратегии – подготовится к сдаче зачёта (+) и не подготовится (-). У Преподавателя также две стратегии – поставить зачёт [+] и не поставить [-].
Тогда
Количественно это можно выразить, например, так
Вследствие того, что в биматричных играх интересы игроков не совпадают, необходимо построить такое решение, которое бы в том или ином, но в одинаковом смысле удовлетворяло обоих игроков.
Рассмотрим случай когда у игроков имеется ровно две стратегии, т.е. m=n=2.
В 22 биматричной игре платёжные матрицы игроков имеют следующий вид
А = В =
Вероятности р1=р, р2=1-р, q1=q, q2=1-q, а средние выигрыши вычисляются по формулам
Ha(p,q) = a11p q+ a12 p(1- q) + a21(1-p)q + a22(1-p)(1-q),
Hb(p, q) = b11pq + b12 p(1-q) + b21(1-p)q + b22(1-p)(1-q), где 0 p 1, 0 q 1,
Пара чисел (p*, q*), o ≤ p * ≤ 1, o ≤ q* ≤ 1, p и q, подчиненных условиям o ≤ p * ≤ 1, o≤q*≤1, одновременно выполнены следующие неравенства HA (p, q* ) ≤ HA (p*, q*). ()
T: всякая биматричная игра имеет хотя бы одну равновесную ситуацию (точку равновесия) в смешанных стратегиях.
Задание смешанной стратегии игрока состоит в указании тех вероятностей, с которыми выбираются его первоначальные стратегии.
Если некоторая пара чисел (p*,q*) претендуют на то, чтобы определить ситуацию равновесия, то необходимо проверить справедливость неравенств (). Для этого воспользуемся теоремой:
T: Выполнение неравенств () равносильно выполнению неравенств
HA (o, q* ) ≤ HA (p*,q*), HB (p*, o ) ≤ HB (p*, q*), ()
HA (1, q* ) ≤ HA (p*, q*), HB (p*, 1 ) ≤ HB (p*, q*).
Запишем средние выигрыши игроков А и В в более удобной форме. Имеем
HA (p, q) = (a11 - a12 - a21 + a22 ) pq + (a11 - a22)p + (a21 - a22 )q + a22
HB (p, q) = (b11 - b12 - b21 + b22 ) pq + (b11 - b22)p + (b21 - b22 )q + b22
Обратимся к первой формуле. Пологая p = 1, а потом p = 0, получаем, что
HA (1, q) = (a11 - a12 - a21 + a22 ) q + a12 + (a21 - a22 )q,
HA (0, q) = (a21 - a22 )q + a22
Рассмотрим разности
HA (p, q) - HA (1, q) = (a11 - a12 - a21 + a22 )pq + (a12 - a22)p –
– (a11 - a12 - a21 + a22)q + a22 – a12,
HA (р, q) - HA (0, q) = (a11 - a12 - a21 + a22)p q + (a12 - a22)p
Пологая C = a11 - a12 - a21 + a22, α = a22- a12, получим
HA (p, q) - HA (1, q) = Cpq – αp – C + α = (p – 1)(Cq - α)
HA (p, q) - HA (0, q) = Cpq – αp = p(Cq - α)
В случае, если пара (p, ) определяет точку равновесия, эти разности неотрицательны, поэтому
(p – 1)(Cq - α) ≥ 0, p(Cq - α) ≥ 0
Из формул для функции HB (p, ) при = 1, = 0 соответственно имеем
HB (p, 1) = (b11 - b12 - b21 + b22 )p + b12 + (b21 - b22 )p + b21,
HB (p, 0) = (b21 - b22 )p + b22
Разности HB (p, q) - HB (p, 1) и HB (p, q) - HB (p, - 0)
С учётом обозначений Д = b11-b12-b21+b22, = b22-b21
Приводятся к виду Hb(p, q) = Hb(p, 1) = (q-1)( Дp-),
Hb(p, ) = Hb(p, 0) = q(Дp-).
И (q-1)(Дp-) 0, q( Дp-) 0
Итак, чтобы в биматричной игре
А = В = пара (p, q)
определяемая равновесную ситуацию, необходимо и достаточно одновременное выполнение следующих неравенств
Пример1: «Студент – Преподаватель» (продолжение).
А = , В =
Проводя необходимые вычисления
С = 2+1-1+0 = 2, α = 0+1=1,
Д = 1+3+2-1 = 5, =-1+2 = 1,
и рассуждения (p-1) (2q-1) 0, (q-1)(5p-1) 0,
p(2q-1) 0, q(5p-1) 0,
получаем,
что 1)p=1,
q
,
2) q=1,
p
,
p=0,
q ≤
,
q=0, p ≤
,
0<p<1,
q =
,
0<q<1, p = .
Число точек пересечения у зигзагов (равновесных ситуаций) равно трём. Две из них отвечают чистым стратегиям игроков,
p=1, q=1: Ha(1,1)=2, Hb(1,1)=1,
p=0, q=0: Ha(0,0)=0, Hb(0,0)=1,
Одна
– смешанная,p=
, q=
:
Ha(
; ) = , Hb(
; ) =
Наилучшим является выбор каждым из игроков первой чистой стратегии – хорошо подготовится к зачёту и поставить зачет.