
- •6. Максимин и минимакс игры. Максиминные и минимаксные стратегии. Нижняя и верхняя цены игры в чистых стратегиях. Соотношение между ними.
- •7.Критерий решения игры в чистых стратегиях.
- •8.Доказательство утверждения .
- •9.Удовлетворительность игровой ситуации для игрока a.
- •10.Удовлетворительность игровой ситуации для игрока b.
- •11.Равновесие в антагонистической игре.
- •12.Смешанные стратегии. Функция выигрыша и цена игры в смешанных стратегиях.
- •14.Основная теорема антагонистических игр Джона фон Неймана и седловая точка функции выигрыша.
- •16.Аналитическое решение игры 2×2 в смешанных стратегияхдля игрока b.
- •17.Геометрический метод нахождения цены игры 2×2 и оптимальных стратегий игрока a.
- •18.Геометрический метод нахождения цены игры 2×2 и оптимальных стратегий игрока b.
- •26.Игры с природой. Показатель благоприятности состояния природы. Риск игрока, принимающего решение. Матрица рисков. Принятие решений в условиях риска и неопределённости.
- •27.Критерий Байеса оптимальности чистых стратегий относительно выигрышей.
- •30. Критерий Лапласа оптимальности чистых стратегий относительно рисков.
- •31. Критерий (крайнего пессимизма) Вальда оптимальности чистых стратегий.
- •32. Максимаксный критерий (крайнего оптимизма) оптимальности чистых стратегий.
- •33. Критерий пессимизма-оптимизма Гурвица оптимальности чистых стратегий относительно выигрышей и рисков. Вероятностная интерпретация коэффициентов критерия Гурвица.
- •34. Обобщенный критерий пессимизма-оптимизма Гурвица относительно выигрышей с коэффициентами для смешанных стратегий
- •1) Стратегия pо принадлежит множеству s : pо s;
- •2) Показатель эффективности g(pо) стратегии pо совпадает с ценой игры gs в стратегиях множества s:
- •35. Выбор коэффициентов
- •36. Выбор коэффициентов обобщённого критерия Гурвица для пессимиста.
- •37. Критерий Сэвиджа.
- •38. Критерий Гермейера оптимальности чистых и смешанных стратегий относительно выигрышей.
- •40. Критерий Ходжа – Лемана оптимальности чистых стратегий относительно выигрышей и рисков.
- •41. Основные понятия и определения в теории неантагонистических (бескоалиционных) игр. Способы задания неантагонистической игры.
- •42. Стратегическая форма игры. Чистые и смешанные стратегии игроков в неантагонистических (бескоалиционных) играх. Функции выигрышей игроков. Доминирование стратегий.
- •44. Геометрическое решение биматричных игр 2x2.
- •45. Аналитическое решение биматричных игр 2x2.
- •46.Модель дуополии Курно.
- •47.Модель дуополии Бертрана.
- •48.Модель «Проблема общего».
- •49.Позиционная форма игры.
- •50.Понятие о конечных позиционных играх с совершенной информацией.
1.Основные понятия и определения теории антагонистических игр.
Основные понятия:
Игра
Игрок
Конфликт Выигрыш
Стратегия
Цена игры
Игровая ситуация
Игра – математическая модель конфликтной ситуации, включающая четко определенные правила действия игроков, добивающихся для себя удачного результата в игре и вынужденных учитывать интересы других участников.
Игроки – заинтересованные в конфликте (игре) стороны.
Под конфликтом понимается всякое явление, в котором участвуют отдельные игроки или группы игроков с определенными несовпадающими интересами. Типичный конфликт характеризуется 3 основными составляющими: заинтересованными сторонами, возможными действиями игроков и интересами сторон.
Стратегия – некоторый план или совокупность правил игрока, по которому он совершает выбор решения при каждом своем личном ходе.
– множество
стратегий k-го
игрока (Pk)
Множество стратегий – все возможные стратегии игроков.
Игровая ситуация
– результат выбора каждым из игроков
своей стратегии.
Множество
игровых ситуаций
– все возможные варианты игровых
ситуаций. Образует ситуационное
пространство игры.
Выигрыши игроков
Платежная матрица – матрица, элементами корой являются выигрыши (проигрыши) игрока.
Антагонистическая игра – игра с нулевой суммой, в которой выигрыш одного игрока равен проигрышу другого.
Платежная биматрица игры:
Стратегии игрока A |
Стратегии игрока B |
|||
|
|
… |
|
|
|
|
|
… |
|
|
|
|
… |
|
… |
… |
… |
… |
… |
|
|
|
… |
|
2.Классификация игр.
Игры классифицируют по различным признакам в соответствии с конкретизацией видов и свойств составляющих характеристик игры.
Кооперативные и некооперативные (коалиционные и бескоалиционные).
Коалиционные – если игроки могут объединяться в группы, беря на себя некоторые обязательства перед другими игроками. Если в игре образование коалиций недопустимо или нецелесообразно, то такие игры называются бескоалиционными. В бескоалиционных играх цель каждого игрока – получение максимально возможного индивидуального выигрыша.
Симметричные и несимметричные.
Симметричные – тогда, когда соответствующие стратегии игроков равноценны, т.е. приносят игрокам одинаковые результаты.
С нулевой и ненулевой суммой.
С нулевой суммой – в которой фонд игры (сумма всех выигрышей) равен сумме всех проигрышей.
Параллельные и последовательные.
Параллельные – игроки ходят одновременно, они не знают, какие стратегии выбрали их оппоненты. Последовательные – участники ходят в заранее установленном порядке и имеют возможность получить информацию о предшествующих действиях других игроков.
С полной и неполной информацией.
С полной информацией – участники знают все ходы, сделанные до текущего момента.
Дискретные и непрерывные.
Дискретные – конечное множество игроков, стратегий; функция выигрыша имеет конечную область определения.
Также, игры можно классифицировать по числу игроков: парные игры, в которых два игрока, и множественные игры, в которых число игроков больше двух. Если в парной игре игроки преследуют противоположные цели, то игра называется антагонистической. В такой игре один из игроков выигрывает ровно столько, сколько проигрывает другой.
3.Функция выигрыша и матрица выигрышей. Чистые стратегии игроков. Соотношение между матрицами выигрышей игроков A и B в антагонистической игре.
Функция выигрыша:
,
k – игроки, s – ситуации.
Функция выигрыша игрока А (на примере задачи «Производство и реализация товаров»)
Функция выигрыша игрока В (на примере задачи «Производство и реализация товаров»)
Матрица выигрышей для игрока А (на примере задачи «Производство и реализация товаров»)
М
атрица
выигрышей для игрока В (на
примере задачи «Производство и реализация
товаров»)
Чистая стратегия игрока – стратегия, которую выберет игрок с вероятностью = 1. Чистая стратегия даёт полную определенность, каким образом игрок продолжит игру.
Если рассматриваемая игра - антагонистическая (т.е. с нулевой суммой выигрышей), то матрица выигрышей В игрока В является противоположной транспонированной матрице выигрышей А игрока А:
4.Доминирование чистых стратегий.
Доминирование – ситуация, при которой одна из стратегий некоторого игрока дает больший выигрыш, нежели другая, при любых действиях его оппонентов.
Цель принципа доминирования – уменьшить размер матрицы, путем выбрасывания из рассмотрения тех стратегий, которые являются очевидно невыгодными.
Доминирование чистых стратегий игрока А
Доминирование чистых стратегий игрока В
5.Максиминный и минимаксный принципы игроков. Показатели эффективности и неэффективности чистых стратегий игроков.
Показатель эффективности: минимальный выигрыш игрока А.
Показатель неэффективности: максимальный проигрыш игрока В.
Максиминный принцип: принцип выбора эффективной стратегии, при котором максимизируется показатель эффективности.
При этом выигрыш
– максимин, или нижняя цена игры.
Минимаксный принцип: принцип выбора эффективной стратегии, при котором минимизируется показатель неэффективности.
При этом проигрыш
- минимакс, или верхняя цена игры.
6. Максимин и минимакс игры. Максиминные и минимаксные стратегии. Нижняя и верхняя цены игры в чистых стратегиях. Соотношение между ними.
Максимин – максимизация минимума возможных доходов. Минимакс - минимизация максимума возможных потерь (учет всех возм-х рисков).
Максиминный принцип: принцип выбора эффективной стратегии, при котором максимизируется показатель эффективности.
;
-
показатель эфф-ти итой стратегии игрока
А.
,
или
.
При этом выигрыш
– максимин, или нижняя цена игры.
Минимаксный принцип: принцип выбора эффективной стратегии, при котором минимизируется показатель неэффективности.
;
-показатель
джитой эффек-ти игрока В.
,
или
.
При этом проигрыш
- минимакс, или верхняя цена игры.
Игрок В выбирает из стратегии
.
Выбирая, он вправе рассчитывать на
рез-ты.
В силу рациональности обоих игроков, А
будет стремится максимизировать свои
доходы, а В мин-ть потери.
Соотношение для α и β:
Для элементов матрицы A имеют место
неравенства
,
,
,
и, следовательно, нижняя цена игры не
больше её верхней цены в чистых стратегиях:
.
7.Критерий решения игры в чистых стратегиях.
Критерий реш-я игры в ЧС - выигрыш одного из них равен проигрышу другого. Внешние факторы отсутствуют. Оба игрока обладают конечным числом действий и логикой, которая определят
их действия. Строки матрицы являются возможными действиями игрока А, столбцы матрицы - возможными действиями игрока В. Возможные действия игроков называются чистыми стратегиями.
Критерий решения игры в чистых стратегиях упирается в критерий существования цены игры в чистых стратегиях.
Свойство: ни одному из игроков А и В, придерживающихся одной из своих оптимальных стратегий невыгодно от нее отклоняться, поскольку в этом случае он не увеличивает свой выигрыш.
Цена
игры в чистых стратегиях
представляет собой значение выигрыша
игрока А, которое он не может увеличить,
если игрок В придерживается своей
оптимальной стратегии и значение
проигрыша игрока В, которое последний
не может уменьшить при условии, что
игрок А действует по своей оптимальной
стратегии.
Теорема:
для того, чтобы существовала цена игры
в чистых стратегиях, т.е. для того чтобы
нижняя цена игры
равнялась верхней цене игры
,
необходимо и достаточно существование
у матрицы этой игры седловой точки.
В игре без седловых точек ни у одного из игроков оптимальных стратегий нет. Т.е. задача в чистых стратегияхи меет решение, если сущ. седловая точка.
8.Доказательство утверждения .
Теорема. Для элементов матрицы A имеют место неравенства , , ,и, следовательно, нижняя цена игры не больше её верхней цены в чистых стратегиях: .
Док-во. По определению показателей
эффективности
стратегий Ai игрока А (
)и
определению показателей неэффективности
стратегий Bj игрока В (
)
имеем:
, cлед-но
доказано.
так как доказанное неравенство
справедливо для любых i=1,..,m, j=1,..n, то оно
будет справедливым в частности для
номеров i=i0 и j=j0 соответственно
максиминной и минимаксной стратегией
Ai0 и Bj0:
.
Тогда в силу
получим требуемое неравенство