Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
490204=МАРКОВ=РЕШЕНИЯ.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
2.39 Mб
Скачать
  1. Приёмы разработки и выбора решений в условиях неопределённости

Решение в условиях неопределённости может приниматься с использованием методов моделирования, основанных на теории игр. Только здесь в качестве соперника будет выступать не разумный противник, а внешняя среда (природа).

Изучение игр в теории управления должно начинаться с построения матрицы выигрышей, о которой будет рассказано ниже. Построение этой матрицы – это самый трудный этап в подготовке принятия решения, так как ошибки в ней могут привести к неверному итоговому результату.

Игра с природой от игры с разумным противником отличается тем, что природа сознательно против нас не действует. Она выступает как партнёр, который не имеет какой-либо цели и случайно выбирает очередные ходы.

Методы принятия решений в играх с природой зависят от известности вероятности состояний природы. Если вероятность неизвестна, то необходимо применять методы принятия решений в условиях неопределённости, если известна, то в условиях риска.

Рассмотрим как в теории игр выглядит матрица выигрышей. Пусть игрок 1 имеет возможных стратегий: , а природа – возможных состояний: . Тогда по этим условиям можно составить следующую матрицу выигрышей:

.

В данной матрице элементы , где и , могут означать как значение выигрыша игрока, так и математическое ожидание выигрыша (среднее значение), если выигрыш – случайная величина.

Так же возможен другой способ задания матрицы игры – не в виде матрицы выигрышей, а виде матрицы рисков. Её ещё называют матрицей упущенных возможностей. Величина риска – это размер платы за отсутствие информации о состоянии игры [2]. Она может быть построена по условиям задачи или на основе матрицы выигрышей.

Риском игрока при использовании им стратегии и при состоянии среды называется разность между выигрышем, который игрок получил бы, если бы знал, что состояние природы будет , и выигрышем, который он получил, не зная этой информации. То есть если бы он знал, что у природы будет состояние , то он наверняка бы использовал другую стратегию, при которой его выигрыш был бы максимален.

Получаем, что при риск будет равен .

Например, пусть матрица выигрышей выглядит следующим образом:

. (1)

Здесь специально для удобства добавлена строка со значениями для каждого . С помощью этой матрицы выигрышей получаем следующую матрицу рисков:

. (2)

Независимо от вида матрица необходимо проверить, нет ли среди стратегий мажорируемых. Мажорирование – это отношение между стратегиями, наличие которого во многих практических случаях даёт возможность сократить размеры исходной матрицы игры [2]. Если такие стратегии в матрице есть, то их нужно исключить.

Для определения наилучших решений при отсутствии информации о вероятности состояний природы используются следующие критерии: максимакса, Вальда, Сэвиджа и Гурвица.

    1. Выбор решения по критерию максимакса.

По этому критерию определяется та стратегия, при которой достигается максимум из максимальных выигрышей для каждой стратегии:

.

Для нашей матрицы наилучшим решением будет , так как при нём достигается максимальный выигрыш, который равен 9.