Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Теория Севиджа

.docx
Скачиваний:
0
Добавлен:
16.06.2026
Размер:
27.08 Кб
Скачать
  1. Решить задачу с помощью критерия Севиджа.

Решим задачу с помощью критерия Сэвиджа (минимаксного критерия сожаления), используя твою матрицу выигрышей:

Шаг 1. Найдём максимумы по каждому столбцу (состоянию природы):

Состояние

Макс значение

1

max⁡(4,3)=4\max(4, 3) = 4

2

max⁡(3,7)=7\max(3, 7) = 7

3

max⁡(8,1)=8\max(8, 1) = 8

4

max⁡(2,3)=3\max(2, 3) = 3

Шаг 2. Построим матрицу сожалений:

(вычисляется по формуле: rij=max⁡j(a⋅j)−aijr_{ij} = \max_j (a_{\cdot j}) - a_{ij}rij​=maxj​(a⋅j​)−aij​)

(4−47−38−83−24−37−78−13−3)=(04011070)\begin{pmatrix} 4 - 4 & 7 - 3 & 8 - 8 & 3 - 2 \\ 4 - 3 & 7 - 7 & 8 - 1 & 3 - 3 \\ \end{pmatrix} = \begin{pmatrix} 0 & 4 & 0 & 1 \\ 1 & 0 & 7 & 0 \\ \end{pmatrix}

Шаг 3. Найдём максимальное сожаление для каждой альтернативы:

  • a1a_1: max⁡(0,4,0,1)=4\max(0, 4, 0, 1) = 4

  • a2a_2: max⁡(1,0,7,0)=7\max(1, 0, 7, 0) = 7

Шаг 4. Выбираем альтернативу с минимальным максимальным сожалением:

min⁡(4,7)=4⇒Выбор: a1\min(4, 7) = 4 \quad \Rightarrow \quad \text{Выбор: } a_1

Ответ: по критерию Сэвиджа выбираем альтернативу a1

  1. Какие условия использования критерия Гурвица?

Критерий Гурвица (также известный как критерий Ходжа–Лемана) — это компромиссный подход между пессимизмом (принцип Вальда) и оптимизмом (принцип максимакса) при принятии решений в условиях неопределённости.

Условия использования критерия Гурвица:

  1. Неизвестны вероятности наступления состояний природы. — Как и в других критериях для неопределенности, у нас нет достоверной информации о вероятностях.

  2. Дано множество альтернатив и состояний природы, заданных в виде матрицы выигрышей.

  3. Решающее лицо стремится к балансу между наилучшим и наихудшим исходом. — Не является ни полностью оптимистом, ни полностью пессимистом.

  4. Вводится коэффициент оптимизма α[0,1]\alpha \in [0, 1] — Значение α\alpha задаётся ЛПР (лицом, принимающим решение):

    • α=1\alpha = 1 — чистый оптимист (будет как по критерию максимакса),

    • α=0\alpha = 0 — чистый пессимист (будет как по критерию Вальда),

    • 0<α<10 < \alpha < 1 — компромисс между ними.

Формула критерия Гурвица:

Для каждой альтернативы aia_i вычисляется значение:

Hi=α⋅max⁡(ai)+(1−α)⋅min⁡(ai)H_i = \alpha \cdot \max(a_i) + (1 - \alpha) \cdot \min(a_i)

Где:

  • max⁡(ai)\max(a_i) — максимальный выигрыш по альтернативе,

  • min⁡(ai)\min(a_i) — минимальный выигрыш по альтернативе,

  • α\alpha — коэффициент оптимизма.

Выбирается альтернатива с наибольшим значением HiH_i.

Когда использовать:

  • Когда отсутствует информация о вероятностях.

  • Когда ЛПР не склоняется ни к полному риску, ни к полному страху.

  • Когда можно выразить субъективный уровень оптимизма.

  1. Решить задачу с помощью критерия Гурвица.

Решим задачу с помощью критерия Гурвица, используя твою матрицу выигрышей:

Шаг 1: Обозначения

  • a1=(4,3,8,2)a_1 = (4, 3, 8, 2)

  • a2=(3,7,1,3)a_2 = (3, 7, 1, 3)

Шаг 2: Выберем коэффициент оптимизма α\alpha

По умолчанию часто используют α=0,5\alpha = 0{,}5, если не задано. Возьмём его:

α=0,5⇒1−α=0,5\alpha = 0{,}5 \quad \Rightarrow \quad 1 - \alpha = 0{,}5

Шаг 3: Находим максимум и минимум для каждой альтернативы

Альтернатива

min

max

a1a_1

2

8

a2a_2

1

7

📌 Шаг 4: Вычисляем значение критерия Гурвица

H(a1)=0,5⋅8+0,5⋅2=4+1=5H(a_1) = 0{,}5 \cdot 8 + 0{,}5 \cdot 2 = 4 + 1 = 5 H(a2)=0,5⋅7+0,5⋅1=3,5+0,5=4H(a_2) = 0{,}5 \cdot 7 + 0{,}5 \cdot 1 = 3{,}5 + 0{,}5 = 4

Ответ:

По критерию Гурвица с α=0,5\alpha = 0{,}5 выбираем альтернативу с наибольшим HH:

Выбор: альтернатива a1

4.Что такое принятие решения в условиях противодействия?

Принятие решения в условиях противодействия (или в условиях конфликта) — это тип ситуаций, когда результат зависит не только от действий лица, принимающего решение (ЛПР), но и от осознанных действий противника (или конкурента), который противодействует достижению наилучшего результата.

Основные характеристики:

  1. Есть второй участник (противник, конкурент, природа с «враждебным характером»), действия которого влияют на исход.

  2. ЛПР исходит из предположения, что противник действует рационально и стремится нанести максимальный ущерб.

  3. Применяются методы теории игр, максимин и другие пессимистические стратегии.

Типичные примеры:

  • Военные стратегии (противник реагирует на твои действия).

  • Бизнес-конкуренция (реакция конкурента на твои шаги).

  • Спортивные соревнования (каждый играет против другого).

В теории:

Такие ситуации называют играми двух лиц с нулевой суммой, где:

  • Один выигрывает — другой теряет,

  • Каждое решение ЛПР проверяется на наихудший возможный ответ противника.

Пример:

Ты →

A1

A2

Противник ↓

B1

2

5

B2

4

1

→ Если ты выберешь A1, противник выберет B2 (чтобы тебе достался 4). → Если A2, он выберет B2, чтобы тебе достался 1.

Ты оцениваешь: что хуже? 4 или 1? И выбираешь стратегию, при которой наихудший исход — наилучший из возможных. Это и есть максимин — ключевой критерий в условиях противодействия.

Ключевой вывод:

Принятие решений в условиях противодействия предполагает, что среда активно сопротивляется, и решение должно быть устойчиво против худших сценариев.

5.Что такое матричная игра?

Начало формы

Матричная игра — это форма представления стратегической игры двух игроков, при которой все возможные выигрыши задаются в виде таблицы (матрицы). Она является основой теории игр и применяется для анализа конфликтных ситуаций, где каждый игрок выбирает стратегию, стремясь максимизировать свой выигрыш (или минимизировать проигрыш), учитывая действия противника.

Основные характеристики матричной игры:

  1. Участвуют два игрока:

    • Первый игрок (например, ЛПР) выбирает строку (стратегию).

    • Второй игрок (противник, природа, конкурент) выбирает столбец.

  2. Результат зависит от стратегии обоих игроков.

  3. Матрица выигрышей показывает, сколько получает первый игрок при каждой комбинации стратегий.

Пример матричной игры:

Стратегия B1

Стратегия B2

A1

4

2

A2

1

3

  • Первый игрок выбирает между A1 и A2.

  • Второй игрок — между B1 и B2.

  • Если выбраны A1 и B2, первый игрок получает 2.

Классификация:

  • Игра с нулевой суммой: выигрыш одного игрока равен проигрышу другого.

  • Антагонистическая игра: интересы игроков полностью противоположны.

  • Чистые стратегии: игрок выбирает одну стратегию.

  • Смешанные стратегии: игрок использует вероятностное распределение стратегий.

Цель игроков:

  • Первый игрок: максимизировать минимальный выигрыш.

  • Второй игрок: минимизировать максимальный выигрыш первого (т.е. действовать как противник).

Применение:

  • Экономика (конкуренция).

  • Политика (международные конфликты).

  • Военное дело (стратегическое планирование).

  • Кибербезопасность, логистика, спорт и др.