
- •Теоретико-игровые методы принятия решений
- •Isbn 5-7046-1383-7
- •Введение
- •Основные понятия теории игр. Классификация игровых моделей
- •Основные понятия теории игр
- •Классификация игровых моделей
- •Контрольные вопросы к разделу 1
- •Антагонистическая игра. Поиск решения на дереве игры
- •Представление антагонистической игры
- •Поиск решения на дереве игры
- •Общие замечания
- •Метод максимина
- •Метод-отсечений
- •Неглубокое -отсечение
- •Глубокое -отсечение
- •Контрольные вопросы к разделу 2
- •Методы решения антагонистических игр, представленных в матричной форме
- •Матричное представление антагонистической игры
- •Наличие седловой точки
- •Методы решения матричных игр при отсутствии седловой точки
- •Смешанные стратегии
- •Метод Лагранжа
- •Метод линейного программирования
- •Итерационный метод Брауна-Робинсона
- •Практический пример
- •Контрольные вопросы к разделу 3
- •Игра двух лиц с произвольной суммой
- •Определение игры двух лиц с произвольной суммой
- •Теория Нэша для некооперативных игр
- •Рефлексивная игра
- •Практический пример
- •Контрольные вопросы к разделу 4
- •Основы теории статистических решений. Игры с «природой»
- •Определение игры «с природой»
- •Методы решения игр «с природой»
- •Случай стохастической неопределенности
- •Случай с неизвестными вероятностями состояний «природы»
- •Контрольные вопросы к разделу 5
- •Игры с упорядоченными исходами
- •Определение игры с упорядоченными исходами при наличии ряда критериев
- •Поиск решения игры с упорядоченными исходами
- •Контрольные вопросы к разделу 6
- •Программная система для решения антагонистических игр
- •Общее описание системы
- •Примеры работы с системой
- •Практический пример
- •Контрольные вопросы к разделу 7
- •Библиографический список
- •Оглавление
Рефлексивная игра
Для поиска решения биматричной игры может быть использована игровая модель в виде так называемой рефлексивной игры, т.е. игры, в которой игрок моделирует поведение соперника.
Рассмотрим рефлексивную игру на примере приведенной выше игры «конкурирующие фирмы» (см. табл. 4.3) в предположении, что игрок Амоделирует поведение (выбор) игрокаВ. Соответствующая матрица игрыG(24) представлена табл. 4.5.
Таблица 4.22
B Ai |
В1 |
В2 |
В3+ |
В4– |
А1 |
(5; 5) |
(2; 7) |
(5; 5) |
(2; 7) |
А2 |
(7; 2) |
(3; 3) |
(3; 3) |
(7; 2) |
У игрока В (в отличие от табл. 4.3) добавились еще две «предполагаемые» стратегии –В3+ – отвечать той же по номеру стратегией, что выбрал игрокА, иВ4–– отвечать противоположной стратегией.
Доказано, что в рефлексивной игре выигрывает тот игрок, у которого ранг рефлексии на единицу больше, чем у соперника. Если ранг рефлексии отличается больше, чем на единицу, то исход игры не ясен.
Практический пример
Пусть имеется фирма, состоящая из двух отделов – производственного (П), в задачу которого входит производство некоторого товара, и транспортного (Т), который должен доставить произведенный товар потребителю. Известно, что доход отдела П от выпуска продукции в объеме одной машины равен aденежных единиц, затраты отдела Т на отправку потребителю одной машины с грузом равенcденежных единиц, а затраты на хранение на складе невывезенной продукции в объеме одной машины составляютbденежных единиц и делятся поровну между отделами П и Т.
Пусть также известно, что в интересующий период времени (например за рабочий день) отдел П может произвести продукции в объеме 5 или 10 машин, а отдел Т для ее перевозки выделить малую автоколонну (4 машины), большую автоколонну (7 машин), две малые автоколонны (8 машин) или одну большую и одну малую автоколонны (11 машин).
Моделью описанной ситуации может быть биматричная игра, представленная табл. 4.6.
Таблица 4.23
Т Пi |
Т1(4) |
Т2(7) |
Т3(8) |
Т4(11) |
П1 (5 машин) |
(4a – b / 2; –4c – b / 2) |
(–5a; –7c) |
(5a; –8c) |
(5a; –11c) |
П2 (10 машин) |
(4a – 3b; –4c – 3b) |
(7a – 1,5b; –7c – 1,5b) |
(8a – b; –8c – b) |
(10a; –11c) |
Необходимо дать рекомендации руководителю отдела П о наиболее выгодном для него объеме производимой продукции (т.е. о выборе стратегии П1или П2), учитывая, что отдел П заинтересован в максимизации своего дохода, а отдел Т – в минимизации своих затрат.
Для получения численных результатов примем a= 10,b= 6,c= 2. Тогда табл. 4.6 примет вид табл.4.7.
Таблица 4.24
Т Пi |
Т1(4) |
Т2(7) |
Т3(8) |
Т4(11) |
|
П1 (5 машин) |
37; –11 |
50; –14 |
50; –16 |
50; –22 |
37 |
П2 (10 машин) |
22; –26 |
61; –23 |
74; –22 |
100; –22 |
22 |
Воспользуемся сначала методом максимина, ориентирующим руководителя отдела П на наиболее осторожное поведение. В этом случае оптимальной является стратегия П1, гарантирующая отделу П доход в 37 денежных единиц (см. последний столбец табл. 4.7). Учитывая интересы отдела Т (как видно из табл. 4.7, минимальные затраты для Т будут при выборе стратегии Т1), именно этот доход и будет получен отделом П.
Отметим, однако, что выбор стратегии П1 вряд ли является наилучшим для отдела П. Так, если он выберет стратегию П2 и сообщит о своем выборе руководителю отдела Т, то тот, руководствуясь интересами своего отдела, должен будет выбрать стратегии Т3или Т4, что гарантирует доход отдела П в 74 или 100 денежных единиц. Более того, можно «стимулировать» отдел Т на выбор стратегии Т4, поделившись с ним в этом случае частью дохода, например в 10 денежных единиц (при этом доход отдела П составит 90 денежных единиц, а затраты отдела Т – всего 12 единиц). Именно так скооперировано и рекомендуется действовать руководителю отдела П.
Изменим несколько исходную ситуацию, повысив стоимость хранения не вывезенной продукции: a= 10,b= 10,c= 2. Получим соответствующую таблицу табл. 4.8.
Таблица 4.25
Т Пi |
Т1(4) |
Т2(7) |
Т3(8) |
Т4(11) |
|
П1 (5 машин) |
35; –13 |
50; –14 |
50; –16 |
50; –22 |
35 |
П2 (10 машин) |
10; –38 |
55; –29 |
70; –26 |
100; –22 |
10 |
Хотя в этом случае минимально возможный доход для отдела П при выборе стратегии П1в 3,5 раза больше, чем при выборе стратегии П2(35 и 10 соответственно),однако и в этом случае лучше выбрать стратегию П2, проинформировав о своем решении руководителя отдела Т. Тот, руководствуясь интересами своего отдела, должен будет выбрать стратегию Т4(соответствующую минимальным затратам отдела Т), что гарантирует доход отдела П в 100 денежных единиц. Заметим, что в этой ситуации в «стимулировании» отдела Т нет необходимости.