5.1. Понятие об игровых моделях

На практике часто приходится сталкиваться с задачами, в которых необходимо принимать решения в условиях неопределенности, т. е. возникают ситуации, в которых две (или более) стороны преследуют различные цели, а результаты любого действия каждой из сторон зависят от мероприятий партнера. Такие ситуации относятся к конфликтным: результат каждого хода игрока зависит от ответного хода противника, цель игры – выигрыш одного из партнеров. В экономике конфликтные ситуации встречаются очень часто и имеют многообразный характер. К ним относятся, например, взаимоотношения между поставщиком и потребителем, покупателем и продавцом, банком и клиентом.

Теория игр – раздел математики, изучающий конфликтные ситуации на основе их математических моделей.

Игра – математическая модель конфликтной ситуации.

Игроки – стороны, участвующие в конфликте.

Выигрыш – исход конфликта. Для того чтобы решить игру, или найти решение игры, следует для каждого игрока выбрать стратегию, которая удовлетворяет условию оптимальности, т. е. один из игроков должен получать максимальный выигрыш, когда второй придерживается своей стратегии. В то же время второй игрок должен иметь минимальный проигрыш, если первый придерживается своей стратегии. Такие стратегии называются оптимальными. Оптимальные стратегии должны также удовлетворять условию устойчивости, т. е. любому из игроков должно быть невыгодно отказаться от своей стратегии в этой игре.

5.2. Платёжная матрица. Нижняя и верхняя цена игры

Рассмотрим парную конечную игру. Пусть игрок А располагает m личными стратегиями, которые обозначим A₁, A₂, …, А_m. Пусть у игрока В имеется n личных стратегий, обозначим их B₁, B₂, …, B_m. Таким образом, игра имеет размерность m × n. В результате выбора игроками любой пары стратегий однозначно определяется исход игры, т. е. выигрыш а_ij игрока А (положительный или отрицательный) и проигрыш (–а_ij) игрока В. Предположим, что значения а_ij известны для любой пары стратегий (A_i, B_j). Матрица , элементами которой являются выигрыши, соответствующие стратегиям A_i и B_j, называетсяплатежной матрицей, или матрицей игры. Общий вид такой матрицы представлен в табл. 5.1.

Таблица 5.1

Платёжная матрица

В_j А_i	В₁	В₂	…	В_n
А₁	а₁₁	а₁₂	…	а_1n
А₂	а₂₁	а₂₂	…	а_2n
…	…	…	…	…
А_m	а_m1	а_m2	…	а_mn

Рассмотрим игру m × n с матрицей и определим наилучшую среди стратегий A₁, A₂, …, А_m. Выбирая стратегию А_i игрок А должен рассчитывать, что игрок В ответит на нее той из стратегий B_j, для которой выигрыш для игрока А минимален (игрок В стремится «навредить» игроку А).

Обозначим через α наименьший выигрыш игрока А при выборе им стратегии А; для всех возможных стратегий игрока В (наименьшее число в i-й строке платежной матрицы).

Назовем α нижней ценой игры, или максимальным выигрышем (максимином). Это гарантированный выигрыш игрока А при любой стратегии игрока В. Следовательно,

. (5.1)

Стратегия, соответствующая максимину, называется максиминной стратегией. Игрок В заинтересован в том, чтобы уменьшить выигрыш игрока А; выбирая стратегию B_j, он учитывает максимально возможный при этом выигрыш для А. Назовем В верхней ценой игры, или минимаксным выигрышем (минимаксом). Это гарантированный проигрыш игрока В. Следовательно,

. (5.2)

Стратегия, соответствующая минимаксу, называется минимаксной стратегией.

Принцип, диктующий игрокам выбор наиболее «осторожных» минимаксной и максиминной стратегий, называется принципом минимакса. Этот принцип следует из разумного предположения, что каждый игрок стремится достичь цели, противоположной цели противника.

Если верхняя и нижняя цены игры совпадают, то общее значение верхней и нижней цены игры α = β = ν называется чистой ценой игры, или ценой игры.

Минимаксные стратегии, соответствующие цене игры, являются оптимальными стратегиями, а их совокупность – оптимальным решением, или решением игры. В этом случае игрок А получает максимальный гарантированный (не зависящий от поведения игрока В) выигрыш ν, а игрок В добивается минимального гарантированного (вне зависимости от поведения игрока А) проигрыша ν. Говорят, что решение игры обладает устойчивостью, т. е. если один из игроков придерживается своей оптимальной стратегии, то для другого не может быть выгодным отклоняться от своей оптимальной стратегии.

Пара чистых стратегий A_i и B_j дает оптимальное решение игры тогда и только тогда, когда соответствующий ей элемент а_ij является одновременно наибольшим в своем столбце и наименьшим в своей строке. Такая ситуация, если она существует, называется седловой точкой (по аналогии с поверхностью седла, которая искривляется вверх в одном направлении и вниз – в другом).

Обозначим А* и В* – пару чистых стратегий, на которых достигается решение игры в задаче с седловой точкой. Введем функцию выигрыша первого игрока на каждой паре стратегий: P(A_i B_j) = а_ij. Тогда из условия оптимальности в седловой точке выполняется двойное неравенство: P(A_i, B*) ≤ Р(А*, В*) ≤ P(A*, B_j), которое справедливо для всех . Действительно, выбор стратегии А* первым игроком при оптимальной стратегии В* второго игрока максимизирует минимальный возможный выигрыш: Р(А*, В*) ≥ P(A_i, B*), а выбор стратегии В* вторым игроком при оптимальной стратегии первого минимизирует максимальный проигрыш: Р(А*, В*) ≤ P(A*, B_j).

1 / 41 2 3 4 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
02.03.2016247.74 Кб10saprykina_ekonomika_organizaciy_2012_0.pdf
#
02.03.2016381.19 Кб15seti_RGR_1(2,3,11,12,13,14,15,16,20,23).docx
#
02.03.2016199.03 Кб11Shishkin_gavra.docx
#
20.09.2019380.93 Кб4Shpora.doc
#
17.08.2019260.1 Кб4shpora_Seti.doc
#
01.04.202552.64 Кб0shporki (1).docx
#
01.04.20251.2 Mб0Shpory.rtf
#
01.04.20251.06 Mб0shpory1.doc
#
01.04.2025340.99 Кб10Shpory_GTU.doc
#
29.07.2019138.72 Кб5Shpory_na_bilety.docx
#
21.09.201994.72 Кб11Shpory_po_BS.doc