Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Shpory_po_MMPR.docx
Скачиваний:
3
Добавлен:
01.07.2025
Размер:
144.51 Кб
Скачать

8. Методы имитационной оптимизации

В методах имитационной оптимизации не производится преобразование задачи к ее детерминированному эквиваленту.

  1. генерируются случайные значения ω в соответствии с известным законом распределения,

  2. для заданного ω вычисляются функции gi(x,ω), i = 0,...,n

  3. решается оптимизационная задача вида x = argmax f(x, ω),

где x ∈gi(x,ω)≤ 0, i=1,...,n при фиксированном ω.

Особенности методов

  1. при произвольном выборе ω допустимое множество альтернатив может оказаться пустым (ограничения несовместны)

  2. общий объем вычислений для получения устойчивых результатов может быть достаточно велик.

Преодоление указанных трудностей достигается на основе применения методов и м и т а ц и о н н о г о у с р е д н е н и я и методов стохастической а п п р о к c и м а ц и и.

9. Принятие решений в условиях риска.

При ПР в условиях риска предполагают, что каждой альтернативе соответствует свое распределение вероятностей на множестве исходов.

Рассмотрим случай, когда в модели проблемной ситуации имеются случайные факторы λ∈Λ с известными законами распределения вероятностей.

В таких задачах связь между реализацией определенной стратегии s∈S и наступлением некоторого исхода g∈G неоднозначна: в зависимости от значения параметра λ, может наступить тот или иной исход, т.о. g=ψ(s,λ).

Пусть G = {g1,…,gn} – множество исходов,

pi(s) – вероятность исхода gi при использовании стратегии s∈S.

Пусть исходы оцениваются по единственному критерию K(g)

(предположительно, что чем больше K(g), тем лучше),

тогда K’(s)=K(ψ(s,λ)) – значение критерия при выборе стратегии s – является случайной величиной с законом распределения вероятностей: F(x,s) = P(K’(s)<x).

Существуют и другие методы принятия решений в условиях риска. Они основаны на построении функции полезности по фон Нейману и Моргенштерну.

10. Постановка задач в условиях целенаправленной среды

Принятие решений в условиях целенаправленной среды связано с тем, что известна цель среды, в соответствии с которой она выбирает свои состояния и которую преследует в своих действиях. Эти действия могут вступать в противоречия с нашими действиями, т.е. формируется конфликтная ситуация. К о н ф л и к т н о й с и т у а ц и е й назовем ситуацию, в которой сталкиваются интересы нескольких оперирующих сторон, преследующих различные цели. Формализованную модель некоторой конфликтной ситуации называют и г р о й . О с н о в н о й ц е л ь ю изучения игр является выявление оптимальной стратегии, приводящей к максимальному выигрышу игрока. При выборе оптимальной стратегии содержание основной гипотезы о поведении противника состоит в предположении, что он разумен и делает все для увеличения своего выигрыша.

Рассмотрим формализованное представление задачи принятия решений в условиях целенаправленной среды. Обобщенную задачу принятия решения в условиях неопределенности можно записать в виде (Δ*Ω, {fj, j∈G} ), где в качестве среды Ω выступают противники, преследующие свои цели fj , j ∈ {2,…,n}. Т.к. имеется n оперирующих сторон, то множество альтернатив Δ*Ω представляется в виде декартового произведения (расчленяется) Δ*Ω = Δ12 *…*Δn , где Δ j - множество альтернатив j-ой оперирующей стороны (игрока), j=1, 2,..., n. Соответственно множество целевых функций fj,j∈G, заданных на Δ*Ω представляет собой множество функций выигрыша игроков, fj : Δ12*…*Δn → R, j∈G={1,2,...,n}. Неопределенность выбора заключается в том, что каждая оперирующая сторона осуществляет выбор альтернативы xj∈Δj , в тоже время качество принятого решения (выигрыш) определяется функцией fj(x 1,..,x n), то есть зависит от выбора других игроков, который заранее неизвестен. Таким образом, каждый j-ый игрок решает задачу

xj* = argmaxfj ( x1 , x2 ,..., xj ,..., xn ), (13.12)

xj∈Δj

и целью теории игр является разрешение этой неопределенной ситуации.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]