35. Теория игр: платежная матрица, чистые и смешанные стратегии, решение игры.

Тео́рия игр – это математическая теория конфликтных ситуаций, т.е. таких ситуаций, в которых сталкиваются интересы двух или более сторон, преследующих различные цели.

Платежная матрица (или матрица игры) – является одним из способов задания матричной игры, который называетсянормальным. Второй способ задания игры – позиционный способ связан развернутой формой задания игры и сводится к построению графа последовательных шагов игры (дереву игры).

Если условие в_ij =-а_ij не выполняется, то есть каждый из игроков имеет свою платежную матрице, тогда эта парная игра является игрой с ненулевой суммой и называетсябиматричной игрой.

Решить матричную (антагонистическую) игру – значит найти для игроковАиВих оптимальные стратегии.

Решение игры связано с матрицей (а_ij) и следующими понятиями:

Нижняя цена игры α=maxmin а_ij(сначала находится минимум в каждой строке, а

i j

потом из полученных минимумов находится максимум). Это гарантированный выигрыш игрока А при любой стратегии игрокаВ.

Верхняя цена игры β=minmax а_ij(сначала находится максимум в каждом столбце,

j i

а потом из полученных максимумов находится минимум). Это гарантированный проигрыш игрока В при любой стратегии игрокаА.

Очевидно α<= β. В случаеα=β говорят о цене игрыν=α=β. Соответствующие цене игры стратегии являются оптимальными, а сама игра естьигра с седловой точкой.

В случае, когда α<β седловой точки не существует. В этом случае решение игры ищестся в смешанных стратегиях. Доказано (Дж. Фон Нейман), что конечная матричная игра имеет, по крайней мере, одно оптимальное решение, возможно в смешанных стратегиях.

Стратегией игрока называется совокупность правил, определяющих выбор варианта действий при каждом личном ходе игрока в зависимости от ситуации, сложившейся в процессе игры.

Стратегия выбираемая игроком сознательно исходя из анализа сложившейся обстановки называется личной (или чистой).

Стратегия игрока называется оптимальной, если она обеспечивает данному игроку (обычно игрокуА) при многократном повторении игры максимально возможный средний выигрыш или минимально возможный средний проигрыш независимо от поведения противника (могут быть использованы и другие показатели оптимальности).

Оптимальные стратегии характеризуются устойчивостью, то есть ни одному из игроков не выгодно отклоняться от своей оптимальной стратегии.

Смешанная стратегиясостоит в том, что при повторении игры происходит случайный выбор стратегии из множества смешиваемых стратегий и для каждой смешиваемой стратегии указывается вероятность (частота) ее выбора. В таком случае для каждого игрока указывается вектор частот, с которым следует применить ту или иную стратегию.

Для игрока АэтоР=(р₁,….р_m), а для игрокаВ– этоQ=(q₁,…….,q_n), при этом

Σ pi=1иΣ q_j=1, средний выигрыш игрокаАравенН_А(Р,Q)=Σ Σ а_ij pi q_j

Если вероятность применения стратегии отлична от нуля, то такая стратегия называется активной.

Оптимальными смешанными стратегиями Р⁰ иQ⁰ называются стратегии, если выполняется неравенство:

Н_А(Р,Q⁰)=< Н_А(Р⁰,Q⁰)=< Н_А(Р⁰,Q)

В этом случае Н_А(Р⁰,Q⁰) называетсяценой игры и обозначается α=<ν=< β

Первое из неравенств означает, что отклонение игрока А от своей оптимальной смешанной стратегии при условии, что игрокВпридерживается своей оптимальной смешанной стратеги, приводит к уменьшению среднего выигрыша игрокаА. Второе из неравенств по смыслу аналогично первому с той лишь разницей что касается игрокаВ.

Решение всякой парной конечной игры с нулевой суммой может быть получено методами линейного программирования.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 1819 / 2419 20 21 22 23 24 > Следующая >>>

Соседние файлы в папке Архив WinRAR_1

#
09.03.20164.33 Mб296Otvety_Stepin (1).doc
#
09.03.2016899.07 Кб350shpory_gotovye_stepin_1.docx
#
09.03.20166.83 Mб125trahtengerts5.pdf
#
09.03.201635.84 Кб73VOPROSY_TViPR2013_VNM.doc
#
09.03.2016182.35 Кб176дз.docx
#
09.03.201611.01 Mб1534Лекции_ХИМИЯ.pdf
#
09.03.201641.48 Кб104Принятие решения(редакт).xlsx