Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Прикладная математика. Шпоры за 2-й семестр.doc
Скачиваний:
42
Добавлен:
16.12.2013
Размер:
453.63 Кб
Скачать

33. Матричная игра как модель конфликтной ситуации. Матрица игры двух лиц с нулевой суммой. Верхняя и нижняя цена игры, седловая точка. Чистые и смешанные стратегии игроков.

В экономике и управлении часто встречаются ситуации, в которых сталкиваются две или более стороны, преследующие различные цели, причем результат, полученный каждой стороной при реализации определенной стратегии, зависит от действий другой стороны. Такие ситуации называют конфликтными. Конфликт двух участников с противоположными интересами называется игрой с нулевой суммой. Участники – игроками. Стратегией – осознанный выбор одного варианта действий из множества. Будем рассматривать конечные игры, в которых множества стратегий игроков конечны. Если первый игрок выбрал свою i-ую стратегию, второй игрок j-ую, то результатом такого совместного выбора будет платеж aij второго игрока первому. Игра с нулевой суммой обозначается матрицей, которая называется платежной. Строки этой матрицы – стратегии первого игрока. Столбцы – второго. Игра происходит партиями: игроки объявляют свой выбор и происходит расплата. Если aij>0, то выигрывает первый игрок. Стратегия называется чистой, если выбор игрока неизменен от партии к партии.

Если мы выберем i-ую стратегию, то второй игрок выберет такую стратегию, чтобы обеспечить себе наибольший выигрыш, т.е. он выберет такой столбец матрицы П, в котором платеж aij минимален. Переберем все наши стратегии и выберем такую из них, при которой второй игрок, действуя максимально разумно, заплатит нам наибольшую сумму (это - минимальный гарантированный выигрыш первого игрока). Величина максимина (альфа) – нижняя цена игры (минимальный гарантированный выигрыш при максимальной стратегии). Верхняя (бета) – минимакс (второй игрок не проиграет более, чем ее). Если минимакс=максимину, то игра имеет седловую точку (платеж максимален в столбце и минимален в строке), общее значение альфа и бета=цена игры. При этом стратегии игроков, соответствующие Седловой точке, называются оптимальными чистыми стратегиями. Если игра не имеет Седловой точки, то решается смешанной стратегией. Она получается случайным чередованием нескольких чистых стратегий.

Пусть игроки – Первый и Второй, играют в матричную игру с матрицей . Пусть стратегия Первого есть , а Второго –. Тогда выигрыш Первого есть случайная величина (с.в.)с рядом распределения:

W(P,Q):

a11

aij

amn

p1 q1

pi qj

pm qn

Если игроки применяют свои смешанные стратегии P(p1, p2,…pm )иQ(q1,q2,…qn) соответственно, Выигрыш первого: выигрышaij

Вероятностьpi qj.

То есть первый игрок с вероятностью pi gj. выигрываетaij.. Математическое ожидание выигрыша первого игрока равно М(P,Q)=pi qjaij есть средний выигрыш.

И это равно математическому ожиданию проигрыша второго игрока.

Пусть есть дисперсия этой случайной величины. Естественно назвать среднее квадратическое отклонение с.в., т.е. риском для первого при игре со стратегиями . Поскольку выигрыш первого есть проигрыш для второго, тоесть случайный проигрыш второго и вполне естественно можно назвать риском игры с такими стратегиями и для второго.

Предположим сначала, что игроки озабочены только максимизацией среднего дохода за партию игры – обычная цель в таких играх. Тогда игроки будут играть со своими оптимальными стратегиями: – Первый игрок и– второй, стратегии оптимальны, еслиМ(P,Q*)М(P*,Q*)М(P*,Q)

Пара (P*,Q*) – решение игры. Математическое ожидание с. в. называетсяценой игры, обозначим ее .

34. Ряд распределения выигрышей в матричной игре. Средний ожидаемый выигрыш и риск. Оптимальные стратегии игроков и цена игры. Представление математического ожидания выигрыша первого игрока и дисперсии в игре с матрицей типа 2x2 в виде…

В экономике и управлении часто встречаются ситуации, в которых сталкиваются две или более стороны, преследующие различные цели, причем результат, полученный каждой стороной при реализации определенной стратегии, зависит от действий другой стороны. Такие ситуации называют конфликтными. Конфликт двух участников с противоположными интересами называется игрой с нулевой суммой. Участники – игроками. Стратегией – осознанный выбор одного варианта действий из множества. Будем рассматривать конечные игры, в которых множества стратегий игроков конечны. Если первый игрок выбрал свою i-ую стратегию, второй игрок j-ую, то результатом такого совместного выбора будет платеж aij второго игрока первому. Игра с нулевой суммой обозначается матрицей, которая называется платежной. Строки этой матрицы – стратегии первого игрока. Столбцы – второго. Игра происходит партиями: игроки объявляют свой выбор и происходит расплата. Если aij>0, то выигрывает первый игрок. Стратегия называется чистой, если выбор игрока неизменен от партии к партии.

Если мы выберем i-ую стратегию, то второй игрок выберет такую стратегию, чтобы обеспечить себе наибольший выигрыш, т.е. он выберет такой столбец матрицы П, в котором платеж aij минимален. Переберем все наши стратегии и выберем такую из них, при которой второй игрок, действуя максимально разумно, заплатит нам наибольшую сумму (это - минимальный гарантированный выигрыш первого игрока). Величина максимина (альфа) – нижняя цена игры (минимальный гарантированный выигрыш при максимальной стратегии). Верхняя (бета) – минимакс (второй игрок не проиграет более, чем ее). Если минимакс=максимину, то игра имеет седловую точку (платеж максимален в столбце и минимален в строке), общее значение альфа и бета=цена игры. При этом стратегии игроков, соответствующие Седловой точке, называются оптимальными чистыми стратегиями. Если игра не имеет Седловой точки, то решается смешанной стратегией. Она получается случайным чередованием нескольких чистых стратегий. После нахождения оптимальных смешанных стратегий, если вероятности больше нуля, то существует на один больше вариант игры: M((P*,Q*)=M((1,0),Q*)=M(P*,(1,0,0,0)= … = цена игры. Ряд распределения: х (из матрицы) и Р(p1*q1,p1*q2,p1*q3…). Цена игры=MX. MX2=сумма Р на х2. DX=MX2+(MX)2.

Риск = корень из дисперсии. .

Стратегии P* и Q* - оптимальные стратегии, если соблюдается свойство:

M(P,Q*)<=M(P*,Q*)<=M(P*,Q)

Вариант игры, в котором риск наибольший, соответствует наибольшей конкуренции. Наименьший – сотрудничеству.

Соседние файлы в предмете Прикладная математика