Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Архив WinRAR_1 / shpory_gotovye_stepin_1.docx
Скачиваний:
350
Добавлен:
09.03.2016
Размер:
899.07 Кб
Скачать

35. Теория игр: платежная матрица, чистые и смешанные стратегии, решение игры.

Тео́рия игр – это математическая теория конфликтных ситуаций, т.е. таких ситуаций, в которых сталкиваются интересы двух или более сторон, преследующих различные цели.

Платежная матрица (или матрица игры) – является одним из способов задания матричной игры, который называетсянормальным. Второй способ задания игры – позиционный способ связан развернутой формой задания игры и сводится к построению графа последовательных шагов игры (дереву игры).

Если условие вij =-аij не выполняется, то есть каждый из игроков имеет свою платежную матрице, тогда эта парная игра является игрой с ненулевой суммой и называетсябиматричной игрой.

Решить матричную (антагонистическую) игру – значит найти для игроковАиВих оптимальные стратегии.

Решение игры связано с матрицей (аij) и следующими понятиями:

Нижняя цена игры α=maxmin аij(сначала находится минимум в каждой строке, а

i j

потом из полученных минимумов находится максимум). Это гарантированный выигрыш игрока А при любой стратегии игрокаВ.

Верхняя цена игры β=minmax аij (сначала находится максимум в каждом столбце,

j i

а потом из полученных максимумов находится минимум). Это гарантированный проигрыш игрока В при любой стратегии игрокаА.

Очевидно α<= β. В случаеα=β говорят о цене игрыν=α=β. Соответствующие цене игры стратегии являются оптимальными, а сама игра естьигра с седловой точкой.

В случае, когда α<β седловой точки не существует. В этом случае решение игры ищестся в смешанных стратегиях. Доказано (Дж. Фон Нейман), что конечная матричная игра имеет, по крайней мере, одно оптимальное решение, возможно в смешанных стратегиях.

Стратегией игрока называется совокупность правил, определяющих выбор варианта действий при каждом личном ходе игрока в зависимости от ситуации, сложившейся в процессе игры.

Стратегия выбираемая игроком сознательно исходя из анализа сложившейся обстановки называется личной (или чистой).

Стратегия игрока называется оптимальной, если она обеспечивает данному игроку (обычно игрокуА) при многократном повторении игры максимально возможный средний выигрыш или минимально возможный средний проигрыш независимо от поведения противника (могут быть использованы и другие показатели оптимальности).

Оптимальные стратегии характеризуются устойчивостью, то есть ни одному из игроков не выгодно отклоняться от своей оптимальной стратегии.

Смешанная стратегиясостоит в том, что при повторении игры происходит случайный выбор стратегии из множества смешиваемых стратегий и для каждой смешиваемой стратегии указывается вероятность (частота) ее выбора. В таком случае для каждого игрока указывается вектор частот, с которым следует применить ту или иную стратегию.

Для игрока АэтоР=(р1,….рm), а для игрокаВ– этоQ=(q1,…….,qn), при этом

Σ pi=1иΣ qj=1, средний выигрыш игрокаАравенНА(Р,Q)=Σ Σ аij pi qj

Если вероятность применения стратегии отлична от нуля, то такая стратегия называется активной.

Оптимальными смешанными стратегиями Р0 иQ0 называются стратегии, если выполняется неравенство:

НА(Р,Q0)=< НА0,Q0)=< НА0,Q)

В этом случае НА0,Q0) называетсяценой игры и обозначается α=<ν=< β

Первое из неравенств означает, что отклонение игрока А от своей оптимальной смешанной стратегии при условии, что игрокВпридерживается своей оптимальной смешанной стратеги, приводит к уменьшению среднего выигрыша игрокаА. Второе из неравенств по смыслу аналогично первому с той лишь разницей что касается игрокаВ.

Решение всякой парной конечной игры с нулевой суммой может быть получено методами линейного программирования.

Соседние файлы в папке Архив WinRAR_1