![](/user_photo/1596_Y1cpK.gif)
- •4. Максиминный и минимаксный принципы игроков. Показатели эффективности и неэффективности чистых стратегий.
- •5. Максимин и минимакс игры. Максиминные и минимаксные стратегии. Нижняя и верхняя цена игры в чистых стратегиях. Соотношение между ними.
- •Критерий решения игры в чистых стратегиях.
- •Доказательство утверждения .
- •Теорема об удовлетворительности игровой ситуации для игрока a.
- •Теорема об удовлетворительности игровой ситуации для игрока b
- •Равновесие в антагонистической игре.
- •Смешанные стратегии. Функция выигрыша и цена игры в смешанных стратегиях.
- •Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре.
- •Теорема о существовании нижней и верхней цен игры в смешанных стратегиях.
- •Теорема о соотношении нижней и верхней цен игры в чистых и смешанных стратегиях.
- •Основная теорема матричных игр Джона фон Неймана и седловая точка функции
- •Аналитическое решение игры 2×2 в смешанных стратегиях.
- •Геометрический метод нахождения цены игры 2×2 и оптимальных стратегий игрока a.
- •Геометрический метод нахождения цены игры 2×2 и оптимальных стратегий игрока b.
- •Геометрический метод нахождения цены игры 2×n и оптимальных стратегий игрока a.
- •Геометрический метод нахождения цены игры m×2 и оптимальных стратегий игрока b.
- •2)В общем случае схема решения игры 2xn или nx2 графическим методом состоит в следующем.
- •Доминирование смешанных стратегий для игрока a.
- •Доминирование смешанных стратегий для игрока b.
- •Решение матричной игры m×n сведением к задаче линейного программирования для игрока a.
- •Решение матричной игры m×n сведением к задаче линейного программирования для игрока b.
- •Основные понятия и определения теории игр с природой.
- •Игры с природой. Показатель благоприятности состояния природы. Риск игрока, принимающего решение. Матрица рисков. Принятие решений в условиях риска и неопределённости.
- •Критерий Байеса оптимальности чистых стратегий относительно выигрышей.
- •Критерий Байеса оптимальности чистых стратегий относительно рисков.
- •Критерий Лапласа оптимальности чистых стратегий относительно выигрышей.
- •Критерий Лапласа оптимальности чистых стратегий относительно рисков.
- •Критерий (крайнего пессимизма) Вальда оптимальности чистых стратегий.
- •Максимаксный критерий (крайнего оптимизма) оптимальности чистых стратегий.
- •Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно выигрышей.
- •Определение показателей оптимизма и пессимизма игрока, принимающего решения по критерию Гурвица относительно выигрышей.
- •Учёт выигрышей по критерию Гурвица крайним пессимистом, крайним оптимистом и нейтралом.
- •Критерий Севиджа
- •Миниминный критерий.
- •Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков.
- •Критерий Гермейера оптимальности чистых стратегий
- •Критерий Ходжа – Лемана оптимальности чистых стратегий относительно выигрышей.
- •Основные понятия и определения в теории неантагонистических (бескоалиционных) игр. Способы задания неантагонистической игры.
- •Стратегическая форма игры. Чистые и смешанные стратегии игроков в неантагонистических (бескоалиционных) играх. Доминирование стратегий.
- •Равновесие по Нэшу в чистых стратегиях.
- •Семейная пара принимает решение о месте куда они могут пойти в свободное время. Так он предлагает футбол, а она балет
- •Равновесие по Нэшу в смешанных стратегиях.
- •46. Аналитическое решение биматричных игр 2×2.
- •Аналогичный анализ можно провести для второго игрока.
- •47. Геометрическое решение биматричных игр 2×2
- •48. Модель дуополии по Курно.
- •49. Модель дуополии по Бертрану.
- •50. Модель «Проблема общего».
- •51. Оптимальность по Парето в неантагонистических (бескоалиционных) играх.
- •52. Позиционная форма игры.
- •53. Понятие о конечных играх с совершенной информацией.
- •54. Стратегическая форма позиционной игры с совершенной информацией.
- •55. Равновесие по Нэшу в позиционной игре с совершенной информацией.
- •56. Обратная индукция и позиционные игры с совершенной информацией.
- •57. Модель дуополии по Штакельбергу.
- •58. Модель последовательного торга.
- •59. Модель «инвесторы и банк».
Определение показателей оптимизма и пессимизма игрока, принимающего решения по критерию Гурвица относительно выигрышей.
Коэффициент оптимизма λ выбирается между 0 и 1, при этом если коэффициент равен 1, то критерий Гурвица превращается в критерий Вальда (по пессимизму результата), если коэффициент равен 0, то в критерий Севиджа.
Число (1- λ) будет характеризовать меру пессимизма игрока А, поэтому в данной работе будем называть коэффициентом пессимизма. Таким образом коэффициенты оптимизма и пессимизма в сумме дают единицу. С увеличением меры ответственности коэффициент λ стремится к нулю: чем серьезнее последствия ошибочных решений, тем больше желание ЛПР перестраховаться. А чем ближе λ к нулю, тем ближе (1- λ) к единице, т.е. тем больше пессимизма. И наоборот. Заметим, что при коэффициенте λ=0,5 видно нейтральность игрока в оценивании ситуации при выборе стратегии.
λ1, λ2,…, λn – числовые коэффициенты количественно характеризующие субъективную оценку игрока А в играх с природой. Такое положение делает обобщенный критерий Гурвица в большей степени субъективным, чем объективным. На результат выбора данной стратегии могут влиять различные ситуации, при которых известны возможные выигрыши.
Существуют некоторые методы выбора данных коэффициентов. Так Лабскер предлагает математико-формализованный метод, для ограничения степени полного произвола субъективного выбора игрока А, который будет разобран ниже.
В.Б.
Волгоградский
предлагает иной подход к выбору
коэффициентов, который состоит в том,
что игрок А сначала субъективно определяет
числовое значение показателя своего
оптимизма λо
[0,1], а затем в зависимости от этого
значения определяет коэффициентыλj,
j=1,2,…,n,
по следующей формуле:
(5.1)
Матиматико-формализованный подход Лабскера выбора коэффициентов λ зависит от средних выигрышей и носит менее субъективный характер, чем модель, предложенная Волгоградским. Её суть заключается в следующем:
Рассматривается игра с природой размером mxn, в которой матрица А является матрицей выигрышей игрока А, матрица B – матрица ранжированных выигрышей. Считается, что все выигрыши положительные. Далее используется специальная формула в зависимости от ситуации (думаю формулу учить не надо):
(5.2)
Где λо – показатель оптимизма, λP – показатель пессимизма;
b – сумма всех выигрышей матрицы, b-1 необходимо для выведения среднего значения выигрышей j-го ранга;
- сумма
выигрышей bij
j-го
ранга; λ j = b j / b
– выражение коэффициентов λj
через выигрыши.
Учёт выигрышей по критерию Гурвица крайним пессимистом, крайним оптимистом и нейтралом.
Весь выигрыш Игрока зависит от того, какой коэффициент оптимизма он выберет. Он может рискнуть и попробовать выиграть большую сумму, а может не рисковать и с уверенностью выиграть меньшую сумму. Таким образом игрок может быть пессимистом, крайним оптимистом или нейтралом.
Коэффициент оптимизма λ выбирается между 0 и 1, при этом если коэффициент равен 1, то критерий Гурвица превращается в критерий Вальда (по пессимизму результата), если коэффициент равен 0, то в максимаксный – то есть игрок будет крайним оптимистом.. Число (1- λ) будет характеризовать меру пессимизма игрока А, поэтому в данной работе будем называть коэффициентом пессимизма. Таким образом коэффициенты оптимизма и пессимизма в сумме дают единицу.
С увеличением меры ответственности коэффициент λ стремится к нулю: чем серьезнее последствия ошибочных решений, тем больше желание ЛПР перестраховаться. А чем ближе λ к нулю, тем ближе (1- λ) к единице, т.е. тем больше пессимизма. И наоборот. Заметим, что при коэффициенте λ=0,5 видно нейтральность игрока в оценивании ситуации при выборе стратегии.
Вероятностная интерпретация коэффициентов критерия Гурвица.
Данный критерий позволяет учитывать комбинацию наихудших состояний. Смысл его состоит в нахождении по специальной формуле эффективности всех стратегий игрока А и последующее сравнении данных показателей эффективности для выбора наиболее оптимальной стратегии, при условии полной неопределённости, т.е. вероятности состояния природы нам неизвестны. Другими словами, при выборе решения мы находим некоторый средний результат при состоянии, находящемся между крайним пессимизмом и безудержным оптимизмом.
Критерий Гурвица целесообразно применять в следующих ситуациях:
Информация о состояниях окружающей среды отсутствует или недостоверна;
Необходимо считаться возможным появлением наихудшего и наилучшего состояния природы;
Допускается некоторый риск.
Рассмотрим
игру с природой размера m
x
n,
m2,
n
2,
с матрицей A=
(aij),
где i=1,2,…,m,
а j=1,2,…,n.
Пусть A1
,A2
,…,Am
–
чистые стратегии игрока А и П1,П2,...Пn
–
состояния природы П. Вероятности
состояний неизвестны.
Введём
специальный коэффициент λ
[0,1], которым обозначим количественную
«меру оптимизма» игрока А при выборе
стратегии. Данный коэффициент выбирает
сам игрок, на основании интуиции, личного
опыта, состояния окружающей среды или
на основе статистических исследований
результатов принятия решений.
Эффективность чистой стратегии Ai в смысле критерия Гурвица [(Hur)p (λ)] характеризуется показателем:
(Hur)pi (λ)= (1- λ)Wi + λMi , i = 1,2,…,m, (2.1)
где Wi и Mi - показатели эффективности стратегии Ai соответственно по критерию Вальда и по максимаксному критерию.
Таким
образом, Игрок А при использовании
критерия Гурвица с коэффициентом λ
[0,1] занимает более взвешенную позицию,
чем если бы он применил критерий Вальда
или максимаксный критерий.
Если
открыть скобки в равенстве (2.1) и несколько
преобразовать данное выражение, то
можно получить показатель эффективности
(Hur)pi
(λ)
в форме линейной функции от аргумента
λ
[0,1] с угловым коэффициентом (Mi -Wi):
(Hur)pi (λ) = (Mi -Wi) λ + Wi (2.2)
Ценой игры в чистых стратегиях по критерию Гурвица с коэффициентом оптимизма λ относительно выигрышей или (Hur)p (λ)-ценой в чистых стратегиях называется максимальный из показателей эффективности:
(2.3)
Оптимальной
во множестве чистых стратегий по критерию
Гурвица с коэффициентом λ
относительно выигрышей, или (Hur)p
(λ)
– оптимальной во множестве
,
называется чистая стратегияAk
с наибольшим (Hur)p
(λ)-показателем
эффективности:
(2.4)
Природа может находиться в самом выгодном положении с вероятностью λ и в самом невыгодном с вероятностью (1- λ). Можно также трактовать параметр λ как степень оптимизма лица, принимающего решения.