
- •6. Максимин и минимакс игры. Максиминные и минимаксные стратегии. Нижняя и верхняя цены игры в чистых стратегиях. Соотношение между ними.
- •7.Критерий решения игры в чистых стратегиях.
- •8.Доказательство утверждения .
- •9.Удовлетворительность игровой ситуации для игрока a.
- •10.Удовлетворительность игровой ситуации для игрока b.
- •11.Равновесие в антагонистической игре.
- •12.Смешанные стратегии. Функция выигрыша и цена игры в смешанных стратегиях.
- •14.Основная теорема антагонистических игр Джона фон Неймана и седловая точка функции выигрыша.
- •16.Аналитическое решение игры 2×2 в смешанных стратегияхдля игрока b.
- •17.Геометрический метод нахождения цены игры 2×2 и оптимальных стратегий игрока a.
- •18.Геометрический метод нахождения цены игры 2×2 и оптимальных стратегий игрока b.
- •26.Игры с природой. Показатель благоприятности состояния природы. Риск игрока, принимающего решение. Матрица рисков. Принятие решений в условиях риска и неопределённости.
- •27.Критерий Байеса оптимальности чистых стратегий относительно выигрышей.
- •30. Критерий Лапласа оптимальности чистых стратегий относительно рисков.
- •31. Критерий (крайнего пессимизма) Вальда оптимальности чистых стратегий.
- •32. Максимаксный критерий (крайнего оптимизма) оптимальности чистых стратегий.
- •33. Критерий пессимизма-оптимизма Гурвица оптимальности чистых стратегий относительно выигрышей и рисков. Вероятностная интерпретация коэффициентов критерия Гурвица.
- •34. Обобщенный критерий пессимизма-оптимизма Гурвица относительно выигрышей с коэффициентами для смешанных стратегий
- •1) Стратегия pо принадлежит множеству s : pо s;
- •2) Показатель эффективности g(pо) стратегии pо совпадает с ценой игры gs в стратегиях множества s:
- •35. Выбор коэффициентов
- •36. Выбор коэффициентов обобщённого критерия Гурвица для пессимиста.
- •37. Критерий Сэвиджа.
- •38. Критерий Гермейера оптимальности чистых и смешанных стратегий относительно выигрышей.
- •40. Критерий Ходжа – Лемана оптимальности чистых стратегий относительно выигрышей и рисков.
- •41. Основные понятия и определения в теории неантагонистических (бескоалиционных) игр. Способы задания неантагонистической игры.
- •42. Стратегическая форма игры. Чистые и смешанные стратегии игроков в неантагонистических (бескоалиционных) играх. Функции выигрышей игроков. Доминирование стратегий.
- •44. Геометрическое решение биматричных игр 2x2.
- •45. Аналитическое решение биматричных игр 2x2.
- •46.Модель дуополии Курно.
- •47.Модель дуополии Бертрана.
- •48.Модель «Проблема общего».
- •49.Позиционная форма игры.
- •50.Понятие о конечных позиционных играх с совершенной информацией.
40. Критерий Ходжа – Лемана оптимальности чистых стратегий относительно выигрышей и рисков.
матрица
выигрышей
матрица потерь
y- параметр отражающий степень доверия ЛПР к оценкам вероятностей состояния природы.
y [0,1]
Чем выше у, тем выше доверие игрока А к оценкам вероятности. А следовательно от того как У зависит доминирует первое слагаемое или второе.
Критерий Ходжа-Лемана
1) Предположим, что матрицей выигрышей игрока А является матрица А.
2) Известны вероятности qi=p(Пj), j=1,…,n, состояний природы Пj, j=1,…,n, удовлетворяющие условию (1).
Таким образом, игроку А надлежит принимать решение в условиях риска.
3) Пусть l=2,
|
(11) |
показатель эффективности стратегии Аi по критерию Вальда,
|
(12) |
показатель эффективности стратегии Аi по критерию Байеса.
Матрица В примет вид
В= |
|
т.е. bi1=Wi, bi2=Bi, i=1,…,m.
4) Коэффициенты l1, l2 выбираются следующим образом:
l1=1-l, l2=l, где lÎ[0, 1]. |
(13) |
Очевидно, что эти коэффициенты удовлетворяют условию (2).
5) По формуле (3), с учетом (11), (12), и (13), показатель эффективности стратегии Аi по критерию Ходжа-Лемана равен:
Gi=libi1+l2bi2=(1-l)Wi+lBi=(1-l)aij+l qiaj i=1,…,m. |
(14) |
|
|
В правой части формулы (14) коэффициент lÎ[0, 1] есть количественный показатель степени доверия игрока А данному распределению вероятностей qi=p(Пj), j=1,…,n, состояний природы Пj, j=1,…,n, а коэффициент (1-l) характеризует количественно степень пессимизма игрока А. Чем больше доверия игрока А данному распределению вероятностей состояний природы, тем меньше пессимизма и наоборот.
6) Цену игры по критерию Ходжа-Лемана находим по формуле (4):
7) Оптимальной стратегией по критерию Ходжа-Лемана является стратегия Аk с наибольшим показателем эффективности:
Gk=G.
Отметим, что критерий Ходжа-Лемана является как-бы промежуточным критерием между критериями Байеса и Вальда. При l=1, из (14) имеем:Gi=Bi и потому критерий Ходжа-Лемана превращается в критерий Байеса. А при l=0, из (14): Gi=Wi и, следовательно, из критерия Ходжа-Лемана получаем критерий Вальда.
Пример.
Исходная матрица
|
q=0,4 П1 |
q=0,3 П2 |
q=0,1 П3 |
q=0,2 П4 |
S1 |
6 |
3 |
4 |
5 |
S2 |
4 |
3 |
6 |
5 |
Далее используя формулы –
матрица выигрышей
матрица потерь
каждый элемент в столбце на соответствующий коэффициент q. Получим следующую таблицу :
Vi1*q1 |
Vi2*q2 |
Vi3*q3 |
Vi4*q4 |
|
|
2,4 |
0,9 |
0,8 |
0,5 |
4,6 |
|
1,6 |
0,9 |
1,2 |
0,5 |
4,2 |
Принимая
=0,6
Получим итоговые данные, для выйгрыша выберем макс. Элемент, для потерь – мин.
HL(выйгрыш) |
HL (потеря) |
4,02 |
5,22 |
3,66 |
4,86 |
Получаем следующий ответ : S*=S1 , V*=4,02 - выигрыш
S*=S2 , V*=4,86 - потеря