Теория Севиджа
.docxРешить задачу с помощью критерия Севиджа.
Решим задачу с помощью критерия Сэвиджа (минимаксного критерия сожаления), используя твою матрицу выигрышей:
Шаг 1. Найдём максимумы по каждому столбцу (состоянию природы):
Состояние |
Макс значение |
1 |
max(4,3)=4\max(4, 3) = 4 |
2 |
max(3,7)=7\max(3, 7) = 7 |
3 |
max(8,1)=8\max(8, 1) = 8 |
4 |
max(2,3)=3\max(2, 3) = 3 |
Шаг 2. Построим матрицу сожалений:
(вычисляется по формуле: rij=maxj(a⋅j)−aijr_{ij} = \max_j (a_{\cdot j}) - a_{ij}rij=maxj(a⋅j)−aij)
(4−47−38−83−24−37−78−13−3)=(04011070)\begin{pmatrix} 4 - 4 & 7 - 3 & 8 - 8 & 3 - 2 \\ 4 - 3 & 7 - 7 & 8 - 1 & 3 - 3 \\ \end{pmatrix} = \begin{pmatrix} 0 & 4 & 0 & 1 \\ 1 & 0 & 7 & 0 \\ \end{pmatrix}
Шаг 3. Найдём максимальное сожаление для каждой альтернативы:
a1a_1: max(0,4,0,1)=4\max(0, 4, 0, 1) = 4
a2a_2: max(1,0,7,0)=7\max(1, 0, 7, 0) = 7
Шаг 4. Выбираем альтернативу с минимальным максимальным сожалением:
min(4,7)=4⇒Выбор: a1\min(4, 7) = 4 \quad \Rightarrow \quad \text{Выбор: } a_1
Ответ: по критерию Сэвиджа выбираем альтернативу a1
Какие условия использования критерия Гурвица?
Критерий Гурвица (также известный как критерий Ходжа–Лемана) — это компромиссный подход между пессимизмом (принцип Вальда) и оптимизмом (принцип максимакса) при принятии решений в условиях неопределённости.
Условия использования критерия Гурвица:
Неизвестны вероятности наступления состояний природы. — Как и в других критериях для неопределенности, у нас нет достоверной информации о вероятностях.
Дано множество альтернатив и состояний природы, заданных в виде матрицы выигрышей.
Решающее лицо стремится к балансу между наилучшим и наихудшим исходом. — Не является ни полностью оптимистом, ни полностью пессимистом.
Вводится коэффициент оптимизма α∈[0,1]\alpha \in [0, 1] — Значение α\alpha задаётся ЛПР (лицом, принимающим решение):
α=1\alpha = 1 — чистый оптимист (будет как по критерию максимакса),
α=0\alpha = 0 — чистый пессимист (будет как по критерию Вальда),
0<α<10 < \alpha < 1 — компромисс между ними.
Формула критерия Гурвица:
Для каждой альтернативы aia_i вычисляется значение:
Hi=α⋅max(ai)+(1−α)⋅min(ai)H_i = \alpha \cdot \max(a_i) + (1 - \alpha) \cdot \min(a_i)
Где:
max(ai)\max(a_i) — максимальный выигрыш по альтернативе,
min(ai)\min(a_i) — минимальный выигрыш по альтернативе,
α\alpha — коэффициент оптимизма.
Выбирается альтернатива с наибольшим значением HiH_i.
Когда использовать:
Когда отсутствует информация о вероятностях.
Когда ЛПР не склоняется ни к полному риску, ни к полному страху.
Когда можно выразить субъективный уровень оптимизма.
Решить задачу с помощью критерия Гурвица.
Решим задачу с помощью критерия Гурвица, используя твою матрицу выигрышей:
Шаг 1: Обозначения
a1=(4,3,8,2)a_1 = (4, 3, 8, 2)
a2=(3,7,1,3)a_2 = (3, 7, 1, 3)
Шаг 2: Выберем коэффициент оптимизма α\alpha
По умолчанию часто используют α=0,5\alpha = 0{,}5, если не задано. Возьмём его:
α=0,5⇒1−α=0,5\alpha = 0{,}5 \quad \Rightarrow \quad 1 - \alpha = 0{,}5
Шаг 3: Находим максимум и минимум для каждой альтернативы
Альтернатива |
min |
max |
a1a_1 |
2 |
8 |
a2a_2 |
1 |
7 |
📌 Шаг 4: Вычисляем значение критерия Гурвица
H(a1)=0,5⋅8+0,5⋅2=4+1=5H(a_1) = 0{,}5 \cdot 8 + 0{,}5 \cdot 2 = 4 + 1 = 5 H(a2)=0,5⋅7+0,5⋅1=3,5+0,5=4H(a_2) = 0{,}5 \cdot 7 + 0{,}5 \cdot 1 = 3{,}5 + 0{,}5 = 4
Ответ:
По критерию Гурвица с α=0,5\alpha = 0{,}5 выбираем альтернативу с наибольшим HH:
Выбор: альтернатива a1
4.Что такое принятие решения в условиях противодействия?
Принятие решения в условиях противодействия (или в условиях конфликта) — это тип ситуаций, когда результат зависит не только от действий лица, принимающего решение (ЛПР), но и от осознанных действий противника (или конкурента), который противодействует достижению наилучшего результата.
Основные характеристики:
Есть второй участник (противник, конкурент, природа с «враждебным характером»), действия которого влияют на исход.
ЛПР исходит из предположения, что противник действует рационально и стремится нанести максимальный ущерб.
Применяются методы теории игр, максимин и другие пессимистические стратегии.
Типичные примеры:
Военные стратегии (противник реагирует на твои действия).
Бизнес-конкуренция (реакция конкурента на твои шаги).
Спортивные соревнования (каждый играет против другого).
В теории:
Такие ситуации называют играми двух лиц с нулевой суммой, где:
Один выигрывает — другой теряет,
Каждое решение ЛПР проверяется на наихудший возможный ответ противника.
Пример:
Ты → |
A1 |
A2 |
Противник ↓ |
|
|
B1 |
2 |
5 |
B2 |
4 |
1 |
→ Если ты выберешь A1, противник выберет B2 (чтобы тебе достался 4). → Если A2, он выберет B2, чтобы тебе достался 1.
Ты оцениваешь: что хуже? 4 или 1? И выбираешь стратегию, при которой наихудший исход — наилучший из возможных. Это и есть максимин — ключевой критерий в условиях противодействия.
Ключевой вывод:
Принятие решений в условиях противодействия предполагает, что среда активно сопротивляется, и решение должно быть устойчиво против худших сценариев.
5.Что такое матричная игра?
Начало формы
Матричная игра — это форма представления стратегической игры двух игроков, при которой все возможные выигрыши задаются в виде таблицы (матрицы). Она является основой теории игр и применяется для анализа конфликтных ситуаций, где каждый игрок выбирает стратегию, стремясь максимизировать свой выигрыш (или минимизировать проигрыш), учитывая действия противника.
Основные характеристики матричной игры:
Участвуют два игрока:
Первый игрок (например, ЛПР) выбирает строку (стратегию).
Второй игрок (противник, природа, конкурент) выбирает столбец.
Результат зависит от стратегии обоих игроков.
Матрица выигрышей показывает, сколько получает первый игрок при каждой комбинации стратегий.
Пример матричной игры:
|
Стратегия B1 |
Стратегия B2 |
A1 |
4 |
2 |
A2 |
1 |
3 |
Первый игрок выбирает между A1 и A2.
Второй игрок — между B1 и B2.
Если выбраны A1 и B2, первый игрок получает 2.
Классификация:
Игра с нулевой суммой: выигрыш одного игрока равен проигрышу другого.
Антагонистическая игра: интересы игроков полностью противоположны.
Чистые стратегии: игрок выбирает одну стратегию.
Смешанные стратегии: игрок использует вероятностное распределение стратегий.
Цель игроков:
Первый игрок: максимизировать минимальный выигрыш.
Второй игрок: минимизировать максимальный выигрыш первого (т.е. действовать как противник).
Применение:
Экономика (конкуренция).
Политика (международные конфликты).
Военное дело (стратегическое планирование).
Кибербезопасность, логистика, спорт и др.
