Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
2ая часть 1-34.doc
Скачиваний:
10
Добавлен:
03.08.2019
Размер:
1.42 Mб
Скачать
  1. Принятие решений в условиях риска. Критерий ожидаемого значения. Полезность. Стоимость информации. Критерий «ожидаемое значение – дисперсия».

Критерий ожидаемого значения.Использование критерия ожидаемого значения обусловлено стремлением максимизировать ожидаемую прибыль (или минимизировать ожидаемые затраты). Использование ожидаемых величин предполагает возможность многократного решения одной и той же задачи, пока не будут получены достаточно точные расчётные формулы. Математически это выглядит так: пусть Х– случайная величина с математическим ожиданием MX и дисперсией DX. Если x1,x2,...,xn – значения случайной величины (с.в.) X, то среднее арифметическое их (выборочное среднее) значений имеет дисперсию . Таким образом, когда n    0 и  MX. Другими словами при достаточно большом объёме выборки разница между средним арифметическим и математическим ожиданием стремится к нулю (так называемая предельная теорема теории вероятности). Следовательно, использование критерия ожидаемое значение справедливо только в случае, когда одно и тоже решение приходится применять достаточно большое число раз. Верно и обратное: ориентация на ожидания будет приводить к неверным результатам, для решений, которые приходится принимать небольшое число раз.

Критерий ожидаемое значение дисперсияКритерий ожидаемого значения можно модифицировать так, что его можно будет применить и для редко повторяющихся ситуаций .Если х – с. в. с дисперсией DX, то среднее арифметическое имеет дисперсию , где n – число слогаемых в . Следовательно, если DX уменьшается, и вероятность того, что близко к MX, увеличивается. Следовательно, целесообразно ввести критерий, в котором максимизация ожидаемого значения прибыли сочетается с минимизацией её дисперсии.

  1. Методы линейного и динамического программирования (принятия решения об оптимальном распределении ресурсов).

Будем считать, что состояние рассматриваемой системы S на k-м шаге (k = 1, 2, ..., п) определяется совокупностью чисел

(3.1)которые получены в результате реализации управления обеспечивающего переход системы S из состояния в состояние Пусть также выполняются два условия:

1. Условие отсутствия последействия. Состояние в которое перешла система S, зависит от исходного состояния и выбранного управления и не зависит от того, каким образом система S перешла в состояние

2. Условие аддитивности. Если в результате реализации k-го шага обеспечен определенный доход также зависящий от исходного состояния системы и выбранного управления то общий доход за п шагов составит

(3.2)где Задача состоит в нахождении оптимальной стратегии управления, т. е. такой совокупности управлений в результате реализации которых система S за п шагов переходит из начального состояния в конечное и при этом функция дохода G(m) принимает наибольшее значение. Принцип оптимальности Беллмана. Каково бы ни было состояние системы перед очередным шагом, надо выбрать управление на этом шаге так, чтобы доход на данном шаге плюс оптимальный доход на всех последующих шагах был максимальный. Из принципа оптимальности следует, что оптимальную стратегию управления можно получить, если сначала найти оптимальную стратегию управления на n-м шаге, затем на двух последних шагах, затем на трех последних шагах и т. д., вплоть до первого шага. Таким образом, решение рассматриваемой задачи динамического программирования целесообразно начинать с определения оптимального решения на последнем, n-м шаге. Для того чтобы найти это решение, очевидно, нужно сделать различные предположения о том, как мог окончиться предпоследний шаг, и с учетом этого выбрать управление обеспечивающее максимальное значение функции дохода Такое управление, выбранное при определенных предположениях о том, как окончился предыдущий шаг, называется условно оптимальным. Следовательно, принцип оптимальности требует находить на каждом шаге условно оптимальное управление для любого из возможных исходов предшествующего шага. Чтобы построить алгоритм решения задач, дадим математическую формулировку принципа оптимальности. Для этого введем некоторые дополнительные обозначения. Обозначив через максимальный доход, получаемый за п шагов при переходе системы S из начального состояния в конечное состояние при реализации оптимальной стратегии управления , а через — максимальный доход, получаемый при переходе из любого состояния в конечное состояние при оптимальной стратегии управления на оставшихся (n - k) шагах. Тогда (3.3)

В можно считать известным. Используя теперь уравнение и рассматривая всевозможные допустимые состояния системы S на (n - 1)-м шаге находим условные оптимальные решения (3.4)

и соответствующие значения функции (3.5)

Таким образом, на n-м шаге находим условно оптимальное управление при любом допустимом состоянии системы после (n - 1)-го шага, т. е. в каком бы состоянии система не оказалась после (n - 1)-го шага, нам уже известно, какое следует принять решение на n-м шаге.Перейдем теперь к рассмотрению функционального уравнения при k = n - 2: (3.6)Решая функциональное уравнение при различных состояниях на (n - 2)-м шаге, получим условно оптимальные управления Каждое из этих управлений совместно с уже выбранным управлением на последнем шаге обеспечивает максимальное значение дохода на двух последних шагах. Последовательно осуществляя описанный выше итерационный процесс, дойдем до первого шага. На этом шаге известно, в каком состоянии может находиться система. Поэтому уже не требуется делать предположений о допустимых состояниях системы, а остается лишь только выбрать управление, которое является наилучшим с учетом условно оптимальных управлений, уже принятых на всех последующих шагах. Чтобы найти оптимальную стратегию управления, т. е. определить искомое решение задачи, нужно теперь пройти всю последовательность шагов, только на этот раз от начала к концу. На первом шаге в качестве оптимального управления возьмем найденное условно оптимальное управление . На втором шаге найдем состояние в которое переводит систему управление Это состояние определяет найденное условно оптимальное управление которое теперь будем считать оптимальным. Зная находим значит, определяем и т. д. В результате этого находим решение задачи, т. е. максимально возможный доход и оптимальную стратегию управления, включающую оптимальные управления на отдельных шагах.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]