Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебники 80358

.pdf
Скачиваний:
10
Добавлен:
01.05.2022
Размер:
4.33 Mб
Скачать

Правило выбора по критерию Гермейера формулируется следующим образом.

Функция потерь дополняется столбцом, содержащим в каждой строке наименьшее произведение имеющегося в ней результата на вероятность соответствующего состояния , т. е. каждое решение оценивается взвешенной величиной. Выбираются те варианты , в строках которых находится наибольшее значение этого столбца.

Отметим, что если вероятности состояний среды точно не известны, а число использований матрицы

решений мало, то, следуя критерию Гермейера, получают неоправданно большой риск.

2.5.2.7. Комбинированный критерий. Объединение критериев Байеса-Лапласа и среднего квадратического отклонения функции полезности (потерь)

Наиболее широко применяемым критерием среди всех рассмотренных является критерий Байеса-Лапласа. Как уже отмечалось, этот критерий учитывает только усредненные значения функции полезности (потерь) и не учитывает диапазон изменения значений функции полезности (потерь), рассеяние ее значений, что иногда приводит к неудовлетворительным решениям.

Для преодоления этого недостатка используется комбинированный критерий, получаемый за счет объединения (свертки) критерия Байеса-Лапласа и критерия среднего квадратического отклонения функции полезности (потерь) на основе принципа абсолютной уступки [68].

Для функции полезности необходимо выбрать такое решение, при котором значение критерия Байеса-Лапласа будет больше, а значение критерия среднего квадратического отклонения функции полезности

231

– меньше. При аддитивном построении комбинированного критерия возьмем со знаком минус. Зададим параметр (весовой коэффициент) и для определим

,

где

Цель задачи заключается в нахождении решения из

условия:

 

Для функции потерь

необходимо

выбрать решение с наименьшими значениями критерия Байеса-

Лапласа

 

 

и

критерия

среднего

квадратического

 

отклонения

функции

полезности

 

.

Поэтому

 

при

построении

комбинированного

критерия возьмем

и

с

положительными знаками и цель решения состоит в нахождении из условия

,

где

Отметим, что при этот комбинированный критерий совпадает с критерием Байеса-Лапласа, а при

– с критерием минимума среднего квадратического отклонения функции полезности. Варьирование значений параметра

232

изменяет свойства комбинированного критерия, позволяя в большей или в меньшей степени в зависимости от величины учитывать величины критериев, включенных в комбинированный критерий.

2.5.3. Построение критериев оценки и выбора решений для второй ситуации априорной информированности ЛПР

Вторая ситуация априорной информированности ЛПР характеризуется активным противодействием среды целям принятия решений ЛПР. В отличие от пассивной среды либо среды, состояния которой реализуются согласно заданному распределению вероятностей, как в первой ситуации, активная среда стремится к выбору таких состояний из множества для которых функция полезности принимает наименьшее значение из множества своих максимально возможных (по решениям) значений. ЛПР в этой ситуации стремится к гарантированному (максиминному) уровню значений функции полезности. При этом анализ процесса принятия решений аналогичен основным приемам теории антагонистических игр.

В рассматриваемой ситуации неопределенность определяется тем, что ЛПР неизвестно, в каком состоянии из множества находится среда. Однако степень неопределенности уменьшена в силу допущения, что среда активно противодействует достижению наибольшей эффективности принимаемых решений путем выбора таких своих состояний, которые сводят к минимуму эффективность принятых решений. Данная ситуация для информационных систем встречается при их функционировании в условиях противодействия противника, хакеров и т.п.

233

2.5.3.1. Максиминный критерий Вальда

Рассмотрим ситуацию принятия решения, когда функция полезности выражается в виде. Тогда

согласно принципу максимина каждому решению присваивается в качестве оценки его гарантированный уровень, который определяется как наименьшее по состояниям среды значение функции полезности:

Оптимальным называется такое решение , для которого

Правило выбора решения в соответствии с максиминным критерием для дискретного множества решений

можно интерпретировать следующим образом.

 

Матрица

решений

(функция

полезности)

 

 

дополняется

еще

одним столбцом из наименьших результатов

 

 

каждой

строки.

Выбираются

те

альтернативы

, в строках которых стоят наибольшие

значения

этого столбца.

 

 

 

Такие выбранные альтернативы полностью исключают риск. Это означает, что ЛПР не может столкнуться с более плохим результатом, чем тот, на который он ориентируется.

Какие бы вероятности

ни встретились,

соответствующий

результат не может оказаться ниже

.

Применение максиминного критерия оправданно, если

ситуация характеризуется следующими условиями:

 

о величинах вероятности

состояний

среды ничего не известно;

 

234

 

приходится считаться с появлением различных вероятностей состояний среды; решение реализуется лишь один раз;

необходимо исключить какой бы то ни было риск.

Итак, каждое решение оценивается согласно принципу максимина по «наихудшему» состоянию среды для этого решения, и «оптимальным» является решение, приводящее к наилучшему из наихудших значений функции полезности.

Если функция полезности выражена в форме потерь , то описанный принцип обычно называют минимаксным. Согласно этому принципу ЛПР пытается свести

к минимуму максимально возможное значение функции потерь при оценке решения в случае второй ситуации априорной информированности. Принцип максимина (минимакса) учит действовать с крайней осторожностью на основании допущения, что противник – мастер. Такая установка не всегда оправданна.

2.5.3.2. Критерии минимаксного риска Сэвиджа

В критерии Сэвиджа функция полезности выражена в форме сожалений или риска. Оптимальным решением или является решение, удовлетворяющее условию:

для функции полезности в виде

где

для функции полезности в виде

,

235

где

Соответствующее критерию Сэвиджа правило выбора

интерпретируется так: каждый элемент

матрицы решений

 

 

вычитается

из

наибольшего результата

 

соответствующего

столбца.

Разности

образуют

матрицу

остатков

. Эта матрица пополняется столбцом наибольших

разностей

. Выбираются те варианты

, в строках

которых стоит наименьшее для этого столбца значение. Величину

можно интерпретировать как потери (штрафы), возникающие в

состоянии

при замене лучшего для него варианта на вариант

. Тогда

величина

представляет

собой (при

интерпретации

в качестве потерь) максимально

возможные (по всем внешним состояниям

) потери в

случае выбора варианта

. Эти максимально

возможные

потери минимизируются за счет выбора подходящего варианта

.

Смысл критерия определяется понятием сожаления (риска).

236

2.5.4. Построение критериев оценки и выбора решений для третьей ситуации априорной информированности ЛПР

Третья ситуация априорной информированности ЛИР определяется наличием факторов, характеризующих два типа промежуточного поведения среды.

Для первого типа характерно наличие у ЛПР некоторой неясной информации об истинных распределениях состояний среды. Какой бы неопределенной эта информация ни была, ЛПР хотя и не может постулировать какую-либо конкретную ситуацию априорной информированности, однако может установить некоторый уровень пессимизма-оптимизма.

Для второго типа предполагается, что ЛПР имеет информацию о состояниях среды, являющуюся промежуточной между первой и второй ситуациями априорной информированности. Данная ситуация априорной информированности лежит между двумя крайними ситуациями, характеризующимися, с одной стороны, полным или частичным знанием распределений вероятностей, а с другой — антагонистическим поведением среды.

2.5.4.1. Критерий Гурвица

Критерии Вальда и Сэвиджа пессимистичны в том смысле, что с каждым решением они связывают состояние среды, приводящее к наихудшим последствиям для принятого ЛПР решения без учета возможных положительных последствий для ЛПР. Положительные и отрицательные последствия поведения среды для ЛПР можно учитывать с помощью взвешенной комбинации наилучшего и наихудшего состояний среды. Такой подход к выбору критерия принятия решений, известный как критерий показателя пессимизмаоптимизма, был предложен Гурвицем. Отличительной особенностью этого критерия является то, что в нем

237

предполагается не полный антагонизм среды, как в критериях Вальда и Сэвиджа, а лишь частичный.

Смысл критерия Гурвица заключается в нахождении оптимального решения или , для которого выполнено условие:

где для функции полезности

для функции потерь

Отметим, что при критерий Гурвица совпадает с критерием Вальда, а при – с максимальным критерием. В первом из этих случаев предполагается, что среда максимально противодействует целям решения, а во втором, наоборот, среда наилучшим образом содействует целям управления. В каждом из этих случаев поведение среды в некотором смысле сравнимо с умным или бездарным противником. Однако если считать, что эти случаи представляют собой крайности, то истинное поведение среды будет промежуточным и может быть охарактеризовано величиной .

При выборе коэффициента могут быть использованы эвристические методы, связанные с опытом и знанием ЛПР особенностей выбора средой своих состояний из множества

. Например, чем более сильными или убедительными доводами ЛПР являются соображения о принятии одного из крайних поведений среды, тем ближе будет к единице или нулю. Значение является равновесной точкой отрезка

238

потерь определяется из условия

[0, 1]. Для этого значения вполне естественно предполагать, что ЛПР считает cреду в равной степени и антагонистической, и максимально содействующей целям ЛПР. Также ЛПР могут быть рассмотрены различные системы разбиения отрезка [0, 1] значений на полную систему непересекающихся подмножеств с последующим заданием на них вероятностных отношений.

Полезным для выбора ЛПР значения может быть рассмотрение того, как меняются оптимальные решения при изменении от нуля до единицы с некоторым шагом. На основе полученного множества решений ЛПР может оценить последствия выбора различных , затем выбрать величину .

2.5.4.2. Критерий Ходжеса-Лемана

Критерий Ходжеса-Лемана позволяет использовать возможную информацию о распределении вероятности состояний среды, имеющуюся у ЛПР, и в то же время обеспечивает заданный уровень гарантированного выбора в случае, если эта информация неточная. Формально критерий Ходжеса-Лемана представляет собой комбинацию критерия Байеса-Лапласа и максиминного критерия Вальда.

Рассмотрим ситуацию принятия решений для функции

. Наилучшее решение

где — весовой коэффициент.

ЛПР пытается выбором весового коэффициента взвесить стремление выбрать решение с минимальным математическим ожиданием и учесть гарантированное наихудшее решение. Выбор ближе к единице будет отражать доверие ЛПР к значениям априорных вероятностей состояний среды и стремление в среднем получить наименьшие потери. При

239

выборе ближе к нулю ЛПР не доверяет априорной информации о поведении среды, стремится к осторожному поведению, готов получить не очень хороший, но гарантированный результат.

Для функции полезности наилучшее решение определяется из условия

2.5.5. Пример оценки отдельных характеристик качества информационной системы в условиях неопределенности

В качестве иллюстрации рассмотрим пример решения задачи выбора лучшего варианта информационной системы, оцениваемого по одному локальному критерию — среднему времени восстановления наиболее важных типовых трактов между отдельными элементами ИС. Для упрощения записи опустим в формулах нижний индекс , который указывает на номер локального критерия.

Пусть сравниваются четыре варианта ИС при пяти состояниях среды, описываемых уровнями загрузки

ИС , где соответствует низкому уровню загрузки ИС, уровню ниже среднего, – среднему уровню,

– высокому уровню, – сверхвысокому уровню. Пусть задача решается при первой ситуации априорной информированности ЛПР: известно априорное распределение вероятностей , определенное на множестве состояний среды . Значения среднего времени восстановления для разных проектов ИС и состояний среды оценены экспертами и приведены в табл. 2.16.

240

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]