- •Тема. Принятие решений в условиях неопределенности
- •1.Теория игр
- •1.1.Предмет и задачи теории игр
- •1.1.1. Основные понятия и определения
- •1.1.2.Антагонистические игры
- •Игра с седловой точкой
- •1.1.3.Решение игр в смешанных стратегиях
- •Необходимость случайного изменения стратегии в игре без седловой точки
- •1.1.4.Приведение матричной игры к задаче линейного программирования
- •2.Принятие решений в условиях неопределенности. Элементы теории статистических решений
- •2.1.Игры с природой в условиях неопределенности.
- •Оценочная функция
- •Особые случаи
- •2.2.Классические критерии принятия решений
- •2.3.Критерий пессимизма-оптимизма Гурвица.
- •2.4.Критерий Сэвиджа (критерий минимакса риска).
- •2.5.Критерий Лапласа.
- •2.6.Критерий Байеса-Лапласа.
- •Литература
- •Принятие решений в условиях риска
- •Обзор критериев принятия решения в условиях риска
- •Принятие решения в условиях риска с возможностью проведения эксперимента
Необходимость случайного изменения стратегии в игре без седловой точки
Допустим, что мы и наш противник многократно играем в игру, матрица которой дана на рис. 4. Если мы выберем определённую стратегию, например максиминную стратегию A1, и будем придерживаться её от игры к игре, то противник, поняв это, будет выбирать каждый раз стратегию B2, в результате чего наш выигрыш не превысит нижней цены игры, т.е. будет равен 3. Если, однако, мы внезапно (для противника) сменим стратегию A1 на стратегию A2, то получим выигрыш 10. Разгадав нашу новую стратегию, противник тут же сменит стратегию B2 на стратегию B3, уменьшив наш выигрыш до 1. И так далее. Здесь проявляется общее правило для игр без седловой точки: игрок, играющий по определённой (детерминированной) стратегии, оказывается в более худшем положении по сравнению с игроком, который меняет стратегию случайным образом.
Впрочем, случайные изменения стратегии надо делать не как попало, а с умом. Пусть A1, A2, …, An — возможные стратегии игрока A. Для получения наибольшего эффекта он должен использовать все или некоторые из этих стратегий случайным образом, но не с одинаковыми, а с разными (специально вычисленными) вероятностями. Пусть стратегия A1,используется с вероятностью p1, стратегия A2,с вероятностью p2 и т. д.
Смешанной
стратегией
SA
игрока А
называется применение чистых стратегий
A1,
A2,
..., An
с вероятностями p1,
p2,
..., pi,
..., pn
причем сумма вероятностей равна 1:
Смешанные стратегии игрока А
записываются в виде матрицы
,
или в виде строки SA=(p1, p2, …, pn). В отличие от смешанных стратегий SA стратегии Aj называют чистыми. При надлежащем подборе вероятностей pj смешанная стратегия может оказаться оптимальной. При этом выигрыш игрока A будет не меньше некоторого значения v, называемого ценой игры. Это значение больше нижней цены игры, но меньше верхней.
Аналогичны образом должен вести себя игрок B. Его оптимальная стратегия также есть некоторая смешанная стратегия
или
в виде строки SB=(q1,
q2,
…,qm),
где qj
— специально подобранные вероятности,
с которыми игрок B
использует стратегии Bj.
Сумма вероятностей равна 1:
При выборе игроком B оптимальной смешанной
стратегии выигрыш игрока A будет не
больше цены игры v.
Чистые стратегии можно считать частным случаем смешанных. На основании принципа минимакса определяется оптимальное решение (или решение) игры: это пара оптимальных стратегий S*A , S*B в общем случае смешанных, обладающих следующим свойством: если один из игроков придерживается своей оптимальной стратегии, то другому не может быть выгодно отступать от своей. Выигрыш, соответствующий оптимальному решению, называется ценой игры v. Цена игры удовлетворяет неравенству α≤v≤β, где α и β — нижняя и верхняя цены игры. Справедлива следующая основная теорема теории игр — теорема Неймана. Каждая конечная игра имеет по крайней мере одно оптимальное решение, возможно, среди смешанных стратегий. Пусть S*A = (p*1, p*2, ..., p*i, ..., p*m) и S*B = (q*1, q*2, ..., q*i, ..., q*n) — пара оптимальных стратегий. Если чистая стратегия входит в оптимальную смешанную стратегию с отличной от нуля вероятностью, то она называется активной.
Справедлива теорема об активных стратегиях: если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш остается неизменным и равным цене игры v, если второй игрок не выходит за пределы своих активных стратегий.
Решением игры называется такая пара стратегий — в общем случае смешанных, систематическое применение которых обеспечивает каждой стороне максимально возможный для нее по условиям игры выигрыш, определяемый ценой игры. Если же одна из сторон отступает от своей оптимальной стратегии (в то время как другая продолжает придерживаться своей), то это ни в коем случае не может быть выгодно для отступающего; это либо оставит его выигрыш неизменным, либо уменьшит. Таким образом, каждая конечная игра имеет решение (возможно, в области смешанных стратегий). Это положение называется основной теоремой теории игр.
Эта теорема имеет большое практическое значение — она дает конкретные модели нахождения оптимальных стратегий при отсутствии седловой точки.
