- •Тема. Принятие решений в условиях неопределенности
- •1.Теория игр
- •1.1.Предмет и задачи теории игр
- •1.1.1. Основные понятия и определения
- •1.1.2.Антагонистические игры
- •Игра с седловой точкой
- •1.1.3.Решение игр в смешанных стратегиях
- •Необходимость случайного изменения стратегии в игре без седловой точки
- •1.1.4.Приведение матричной игры к задаче линейного программирования
- •2.Принятие решений в условиях неопределенности. Элементы теории статистических решений
- •2.1.Игры с природой в условиях неопределенности.
- •Оценочная функция
- •Особые случаи
- •2.2.Классические критерии принятия решений
- •2.3.Критерий пессимизма-оптимизма Гурвица.
- •2.4.Критерий Сэвиджа (критерий минимакса риска).
- •2.5.Критерий Лапласа.
- •2.6.Критерий Байеса-Лапласа.
- •Литература
- •Принятие решений в условиях риска
- •Обзор критериев принятия решения в условиях риска
- •Принятие решения в условиях риска с возможностью проведения эксперимента
1.1.1. Основные понятия и определения
Задолго до появления теории игр широко использовали подобные упрощённые модели конфликтов – игры в буквальном смысле слова: шашки, шахматы, домино и т.д. Отсюда и название самой теории игр, и различные термины.
ИГРОЙ называется всякая конфликтная ситуация, изучаемая в теории игр и представляющая собой упрощенную, схематизированную модель ситуации. От реальной конфликтной ситуации игра отличается тем, что не включает второстепенные, несущественные для ситуации факторы и ведется по определенным правилам, которые в реальной ситуации могут нарушаться.
Всякая игра включает в себя три элемента: участников игры – игроков, правила игры, оценку результатов действий игроков.
Игроком (лицом, стороной, или коалицией) называется отдельная совокупность интересов, отстаиваемая в игре. Если данную совокупность интересов отстаивает несколько участников игры, то они рассматриваются как один игрок. Игроки, имеющие противоположные по отношению друг к другу интересы, называются противниками. В игре могут сталкиваться интересы двух или более противников. Одна реализация игры называется партией; выбор действия (в пределах правил) – ходом. Ходы бывают личные и случайные. Личный ход предполагает сознательный выбор того или иного действия, разрешенного правилами игры, а случайный – не зависит от воли игрока (например, он может быть определён подбрасыванием монеты или игральной кости и т.п.). Игры, в которых имеются личные ходы, называются стратегическими. Игры, состоящие только из случайных ходов, называют азартными. Характерный пример – игра в лото.
Стратегией игрока называется совокупность правил, определяющих выбор варианта действий при каждом личном ходе в зависимости от сложившейся ситуации.
В зависимости от числа стратегий игры делятся на "конечные" и "бесконечные". Игра называется конечной, если у каждого игрока имеется в распоряжении только конечное число стратегий. В противном случае игра называется бесконечной.
Оптимальной стратегией игрока называется такая, которая обеспечивает ему наилучшее положение в данной игре, т.е. максимальный выигрыш. Если игра повторяется неоднократно и содержит, кроме личных, ещё и случайные ходы, оптимальная стратегия обеспечивает максимальный средний выигрыш.
Игра называется игрой с нулевой суммой, если сумма выигрышей всех игроков равна нулю, т.е. каждый игрок выигрывает только за счёт других. Самый простой случай – парная игра с нулевой суммой – называется антагонистической. Теория антагонистических игр – наиболее развитый раздел теории игр, с чёткими рекомендациями.
1.1.2.Антагонистические игры
Опр. Антагонистической игрой называется система G=<A,B,H>, где A,B - непустые множества стратегий соответственно первого и второго игроков; H(a,b) – функция выигрыша игрока A (то есть функция потерь игрока B), aA, bB.
Таким образом, в процессе игры каждый игрок выбирает свою стратегию, в результате чего образуется ситуация (a, b), которой соответствует выигрыш Н(a, b) для первого игрока и – Н(a, b) для второго.
Антагонистические игры, в которых каждый игрок имеет конечное множество стратегий, называются матричными играми. Для задания такой игры достаточно выписать так называемую платежную матрицу, в которой строки соответствуют стратегиям первого игрока, а столбцы – стратегиям второго игрока. Элементами матрицы служат выигрыши первого игрока.
Рассмотрим антагонистические игры более подробно. В этой игре, как было сказано выше, участвуют два игрока А и В, имеющих противоположные интересы: выигрыш одного равен проигрышу другого. Так как выигрыш игрока А равен выигрышу игрока В с обратным знаком, мы можем интересоваться только выигрышем игрока А. Естественно, А хочет максимизировать свой выигрыш, а В – минимизировать свой проигрыш. Пусть у игрока А имеется n возможных стратегий А1, А2, . . . ,Аn, а у противника – m – возможных стратегий В1, В2, . . ., Вm (такая игра называется игрой nm). Обозначим аij выигрыш игрока А в случае, если мы пользуемся стратегией Аi, а противник – стратегией Вj. Предположим, что для каждой пары стратегий (Аi, Вj) выигрыш (или средний выигрыш) аij нам известен. Тогда в принципе можно составить прямоугольную таблицу (матрицу), в которой перечислены стратегии игроков и соответствующие выигрыши (см. таблицу 1).
Таблица 1. Платёжная матрица
-
B
A
В1
В2
. . .
Вm
А1
а11
а12
а1m
А2
а21
а2m
. . .
Аn
an1
аnm
Если такая таблица составлена, то говорят, что игра G приведена к матричной форме. Такая таблица называется платежной матрицей или просто матрицей игры. Отметим, что само по себе приведение игры к такой форме уже может составить трудную задачу, а иногда и практически не выполнимую, из-за необозримого множества стратегий. Заметим, что если игра приведена к матричной форме, то многоходовая игра фактически сведена к одноходовой – от игрока требуется сделать только один ход: выбрать стратегию. Будем кратко обозначать матрицу игры П=(аij). Если конечная игра записана в виде такой матрицы, то говорят, что она приведена к нормальной форме. Но попробуйте, например, записать и нормальной форме обыкновенные шахматы! Вы сразу столкнетесь с тем, что количество возможных стратегий необозримо велико — настолько велико, что их перечисление выходит за пределы возможностей не только человека, но и современной вычислительной машины. А жаль! Потому что, если бы построение матрицы шахматной игры было возможно, это имело бы очень любопытные последствия... Но не будем забегать вперед.
Рассмотрим пример. Игроки А и В одновременно и независимо друг от друга записывает каждый одно из трёх чисел: 1, 2 или 3. Если сумма записанных чисел оказывается четной, то игрок В платит игроку А эту сумму; если же сумма чисел оказывается нечетной, то эту сумму выплачивает игрок А игроку В.
У игрока А три стратегии:
А1 – записать 1; А2 – записать 2; А3 – записать 3.
Стратегии игрока В аналогичны. Рассматриваемая игра есть игра 33. Платёжная матрица имеет три строки и три столбца. Эта матрица представлена таблицей 2.
Таблица 2. Исходная платёжная матрица
B A |
В1 |
В2 |
В3 |
А1 |
2 |
-3 |
4 |
А2 |
-3 |
4 |
-5 |
А3 |
4 |
-5 |
6 |
В таблице 2 одни элементы являются положительными, а другие отрицательными. Преобразуем полученную матрицу, прибавив к каждому её элементу значение 6. Преобразованная матрица представлена таблицей 3. С точки зрения анализа оптимальных стратегий эта матрица эквивалентна исходной.
Таблица 3 Преобразованная платёжная матрица
B A |
В1 |
В2 |
В3 |
А1 |
8 |
3 |
10 |
А2 |
3 |
10 |
1 |
А3 |
10 |
1 |
12 |
Принцип максимина
Естественный принцип оптимальности для антагонистической игры — принцип максимина (минимакса). Будем анализировать эту игру, используя платёжную матрицу, показанную на табл. 3. Предположим, что игрок А выбирает стратегию А1. Тогда в зависимости от того, какую стратегию изберёт противник, наш выигрыш будет равен либо 8, либо 3, либо 10. Итак, выбирая стратегию А1, мы в худшем случае получаем выигрыш 3. Если же выберем стратегию А2 или А3, то будем иметь в худшем случае выигрыш 1. Запишем минимальные возможные выигрыши для разных стратегий Аi в виде дополнительного столбца платёжной матрицы (табл. 4). Ясно, что следует выбирать ту стратегию, где минимальный возможный выигрыш оказывается наибольшим (по сравнению с остальными стратегиями). В данном случае это стратегия А1. Выигрыш 3 является максимальным в тройке минимальных выигрышей (в тройке 3, 1, 1). Его называют максиминным выигрышем или, проще, максимином. У него ещё одно название – нижняя цена игры.
Табл. 4. Нижняя и верхняя цена игры
B A |
В1 |
В2 |
В3 |
αi |
А1 |
8 |
3 |
10 |
3 |
А2 |
3 |
10 |
1 |
1 |
А3 |
10 |
1 |
12 |
1 |
βi |
10 |
10 |
12 |
|
Аналогичным образом рассуждает противник. Если он выберет стратегию В1, то в худшем для себя случае позволит нам получить выигрыш 10. То же можно сказать и о стратегии В2. При выборе стратегии В3 худший (для противника) случай соответствует нашему выигрышу, равному 12. Числа 10, 10, 12 – максимальные значения наших выигрышей, отвечающие стратегиям противника В1, В2, В3 соответственно. Выпишем эти значения в виде дополнительной строки платёжной матрицы (см. табл. 4). Ясно, что противник должен выбрать ту стратегию, где наш выигрыш оказывается наименьшим. Это есть либо стратегия В1, либо В2. Обе стратегии являются минимаксными, обе они дают противнику гарантию, что наш выигрыш не превысит минимакса, или, иначе, верхней цены игры, равной в данном случае 10.
В
ерхняя
и нижняя цены игры.
Величина называется нижней ценой игры.
Величина называется верхней ценой игры.
Наша максиминная стратегия, равно как и минимаксная стратегия противника, является наиболее осторожной, "перестраховочной" стратегией. Принцип осторожности, диктующий игрокам выбор таких стратегий, называют принципом минимакса.
Подведём итоги. Антагонистические игры, в которых каждый игрок имеет конечное множество стратегий, называются матричными играми. Для задания такой игры достаточно выписать так называемую платежную матрицу, в которой строки соответствуют стратегиям первого игрока, а столбцы - стратегиям второго игрока. Элементами матрицы служат выигрыши первого игрока.
Означает ли всё это, что теория игр рекомендует придерживаться только минимаксных (максиминных) стратегий? Ответ на этот вопрос зависит от того, имеет или не имеет платёжная матрица игры седловую точку.
