- •Введение
- •Основные понятия и положения
- •Приёмы разработки и выбора решений в условиях неопределённости
- •Выбор решения по критерию максимакса.
- •Выбор решения по критерию Вальда.
- •Выбор решения по критерию Сэвиджа.
- •Выбор решения по критерию Гурвица.
- •Приёмы разработки и выбора решений в условиях риска
- •Позиционные игры
- •Приёмы разработки и выбора решений в условиях конфликта.
- •Заключение
- •Вопросы
- •Библиографический список
Приёмы разработки и выбора решений в условиях неопределённости
Решение в условиях неопределённости может приниматься с использованием методов моделирования, основанных на теории игр. Только здесь в качестве соперника будет выступать не разумный противник, а внешняя среда (природа).
Изучение игр в теории управления должно начинаться с построения матрицы выигрышей, о которой будет рассказано ниже. Построение этой матрицы – это самый трудный этап в подготовке принятия решения, так как ошибки в ней могут привести к неверному итоговому результату.
Игра с природой от игры с разумным противником отличается тем, что природа сознательно против нас не действует. Она выступает как партнёр, который не имеет какой-либо цели и случайно выбирает очередные ходы.
Методы принятия решений в играх с природой зависят от известности вероятности состояний природы. Если вероятность неизвестна, то необходимо применять методы принятия решений в условиях неопределённости, если известна, то в условиях риска.
Рассмотрим
как в теории игр выглядит матрица
выигрышей. Пусть игрок 1 имеет
возможных стратегий:
,
а природа –
возможных состояний:
.
Тогда по этим условиям можно составить
следующую матрицу выигрышей:
.
В
данной матрице элементы
,
где
и
,
могут означать как значение выигрыша
игрока, так и математическое ожидание
выигрыша (среднее значение), если выигрыш
– случайная величина.
Так же возможен другой способ задания матрицы игры – не в виде матрицы выигрышей, а виде матрицы рисков. Её ещё называют матрицей упущенных возможностей. Величина риска – это размер платы за отсутствие информации о состоянии игры [2]. Она может быть построена по условиям задачи или на основе матрицы выигрышей.
Риском
игрока при использовании им стратегии
и при состоянии среды
называется разность между выигрышем,
который игрок получил бы, если бы знал,
что состояние природы будет
,
и выигрышем, который он получил, не зная
этой информации. То есть если бы он знал,
что у природы будет состояние
,
то он наверняка бы использовал другую
стратегию, при которой его выигрыш был
бы максимален.
Получаем,
что при
риск будет равен
.
Например, пусть матрица выигрышей выглядит следующим образом:
.
(1)
Здесь
специально для удобства добавлена
строка со значениями
для каждого
.
С помощью этой матрицы выигрышей получаем
следующую матрицу рисков:
.
(2)
Независимо от вида матрица необходимо проверить, нет ли среди стратегий мажорируемых. Мажорирование – это отношение между стратегиями, наличие которого во многих практических случаях даёт возможность сократить размеры исходной матрицы игры [2]. Если такие стратегии в матрице есть, то их нужно исключить.
Для определения наилучших решений при отсутствии информации о вероятности состояний природы используются следующие критерии: максимакса, Вальда, Сэвиджа и Гурвица.
Выбор решения по критерию максимакса.
По этому критерию определяется та стратегия, при которой достигается максимум из максимальных выигрышей для каждой стратегии:
.
Для
нашей матрицы
наилучшим решением будет
,
так как при нём достигается максимальный
выигрыш, который равен 9.
