Учебники 80358
.pdfПравило выбора по критерию Гермейера формулируется следующим образом.
Функция потерь дополняется столбцом, содержащим в каждой строке наименьшее произведение имеющегося в ней результата на вероятность соответствующего состояния , т. е. каждое решение оценивается взвешенной величиной. Выбираются те варианты , в строках которых находится наибольшее значение этого столбца.
Отметим, что если вероятности состояний среды точно не известны, а число использований матрицы
решений мало, то, следуя критерию Гермейера, получают неоправданно большой риск.
2.5.2.7. Комбинированный критерий. Объединение критериев Байеса-Лапласа и среднего квадратического отклонения функции полезности (потерь)
Наиболее широко применяемым критерием среди всех рассмотренных является критерий Байеса-Лапласа. Как уже отмечалось, этот критерий учитывает только усредненные значения функции полезности (потерь) и не учитывает диапазон изменения значений функции полезности (потерь), рассеяние ее значений, что иногда приводит к неудовлетворительным решениям.
Для преодоления этого недостатка используется комбинированный критерий, получаемый за счет объединения (свертки) критерия Байеса-Лапласа и критерия среднего квадратического отклонения функции полезности (потерь) на основе принципа абсолютной уступки [68].
Для функции полезности необходимо выбрать такое решение, при котором значение критерия Байеса-Лапласа будет больше, а значение критерия среднего квадратического отклонения функции полезности
231
– меньше. При аддитивном построении комбинированного критерия возьмем со знаком минус. Зададим параметр (весовой коэффициент) и для определим
,
где
Цель задачи заключается в нахождении решения из
условия: |
|
Для функции потерь |
необходимо |
выбрать решение с наименьшими значениями критерия Байеса-
Лапласа |
|
|
и |
критерия |
среднего |
квадратического |
|
отклонения |
функции |
полезности |
|
|
. |
Поэтому |
|
при |
построении |
комбинированного |
критерия возьмем |
и |
с |
положительными знаками и цель решения состоит в нахождении из условия
,
где
Отметим, что при этот комбинированный критерий совпадает с критерием Байеса-Лапласа, а при
– с критерием минимума среднего квадратического отклонения функции полезности. Варьирование значений параметра
232
изменяет свойства комбинированного критерия, позволяя в большей или в меньшей степени в зависимости от величины учитывать величины критериев, включенных в комбинированный критерий.
2.5.3. Построение критериев оценки и выбора решений для второй ситуации априорной информированности ЛПР
Вторая ситуация априорной информированности ЛПР характеризуется активным противодействием среды целям принятия решений ЛПР. В отличие от пассивной среды либо среды, состояния которой реализуются согласно заданному распределению вероятностей, как в первой ситуации, активная среда стремится к выбору таких состояний из множества для которых функция полезности принимает наименьшее значение из множества своих максимально возможных (по решениям) значений. ЛПР в этой ситуации стремится к гарантированному (максиминному) уровню значений функции полезности. При этом анализ процесса принятия решений аналогичен основным приемам теории антагонистических игр.
В рассматриваемой ситуации неопределенность определяется тем, что ЛПР неизвестно, в каком состоянии из множества находится среда. Однако степень неопределенности уменьшена в силу допущения, что среда активно противодействует достижению наибольшей эффективности принимаемых решений путем выбора таких своих состояний, которые сводят к минимуму эффективность принятых решений. Данная ситуация для информационных систем встречается при их функционировании в условиях противодействия противника, хакеров и т.п.
233
2.5.3.1. Максиминный критерий Вальда
Рассмотрим ситуацию принятия решения, когда функция полезности выражается в виде. Тогда
согласно принципу максимина каждому решению присваивается в качестве оценки его гарантированный уровень, который определяется как наименьшее по состояниям среды значение функции полезности:
Оптимальным называется такое решение , для которого
Правило выбора решения в соответствии с максиминным критерием для дискретного множества решений
можно интерпретировать следующим образом. |
|
|||
Матрица |
решений |
(функция |
полезности) |
|
|
|
дополняется |
еще |
|
одним столбцом из наименьших результатов |
|
|||
|
каждой |
строки. |
Выбираются |
те |
альтернативы |
, в строках которых стоят наибольшие |
|||
значения |
этого столбца. |
|
|
|
Такие выбранные альтернативы полностью исключают риск. Это означает, что ЛПР не может столкнуться с более плохим результатом, чем тот, на который он ориентируется.
Какие бы вероятности |
ни встретились, |
соответствующий |
результат не может оказаться ниже |
. |
Применение максиминного критерия оправданно, если
ситуация характеризуется следующими условиями: |
|
о величинах вероятности |
состояний |
среды ничего не известно; |
|
234 |
|
приходится считаться с появлением различных вероятностей состояний среды; решение реализуется лишь один раз;
необходимо исключить какой бы то ни было риск.
Итак, каждое решение оценивается согласно принципу максимина по «наихудшему» состоянию среды для этого решения, и «оптимальным» является решение, приводящее к наилучшему из наихудших значений функции полезности.
Если функция полезности выражена в форме потерь , то описанный принцип обычно называют минимаксным. Согласно этому принципу ЛПР пытается свести
к минимуму максимально возможное значение функции потерь при оценке решения в случае второй ситуации априорной информированности. Принцип максимина (минимакса) учит действовать с крайней осторожностью на основании допущения, что противник – мастер. Такая установка не всегда оправданна.
2.5.3.2. Критерии минимаксного риска Сэвиджа
В критерии Сэвиджа функция полезности выражена в форме сожалений или риска. Оптимальным решением или является решение, удовлетворяющее условию:
для функции полезности в виде
где
для функции полезности в виде |
, |
235
где
Соответствующее критерию Сэвиджа правило выбора
интерпретируется так: каждый элемент |
матрицы решений |
|||
|
|
вычитается |
из |
|
наибольшего результата |
|
соответствующего |
||
столбца. |
Разности |
образуют |
матрицу |
остатков |
. Эта матрица пополняется столбцом наибольших |
||||
разностей |
. Выбираются те варианты |
, в строках |
которых стоит наименьшее для этого столбца значение. Величину
можно интерпретировать как потери (штрафы), возникающие в
состоянии |
при замене лучшего для него варианта на вариант |
||
. Тогда |
величина |
представляет |
собой (при |
интерпретации |
в качестве потерь) максимально |
||
возможные (по всем внешним состояниям |
) потери в |
||
случае выбора варианта |
. Эти максимально |
возможные |
потери минимизируются за счет выбора подходящего варианта
.
Смысл критерия определяется понятием сожаления (риска).
236
2.5.4. Построение критериев оценки и выбора решений для третьей ситуации априорной информированности ЛПР
Третья ситуация априорной информированности ЛИР определяется наличием факторов, характеризующих два типа промежуточного поведения среды.
Для первого типа характерно наличие у ЛПР некоторой неясной информации об истинных распределениях состояний среды. Какой бы неопределенной эта информация ни была, ЛПР хотя и не может постулировать какую-либо конкретную ситуацию априорной информированности, однако может установить некоторый уровень пессимизма-оптимизма.
Для второго типа предполагается, что ЛПР имеет информацию о состояниях среды, являющуюся промежуточной между первой и второй ситуациями априорной информированности. Данная ситуация априорной информированности лежит между двумя крайними ситуациями, характеризующимися, с одной стороны, полным или частичным знанием распределений вероятностей, а с другой — антагонистическим поведением среды.
2.5.4.1. Критерий Гурвица
Критерии Вальда и Сэвиджа пессимистичны в том смысле, что с каждым решением они связывают состояние среды, приводящее к наихудшим последствиям для принятого ЛПР решения без учета возможных положительных последствий для ЛПР. Положительные и отрицательные последствия поведения среды для ЛПР можно учитывать с помощью взвешенной комбинации наилучшего и наихудшего состояний среды. Такой подход к выбору критерия принятия решений, известный как критерий показателя пессимизмаоптимизма, был предложен Гурвицем. Отличительной особенностью этого критерия является то, что в нем
237
предполагается не полный антагонизм среды, как в критериях Вальда и Сэвиджа, а лишь частичный.
Смысл критерия Гурвица заключается в нахождении оптимального решения или , для которого выполнено условие:
где для функции полезности
для функции потерь
Отметим, что при критерий Гурвица совпадает с критерием Вальда, а при – с максимальным критерием. В первом из этих случаев предполагается, что среда максимально противодействует целям решения, а во втором, наоборот, среда наилучшим образом содействует целям управления. В каждом из этих случаев поведение среды в некотором смысле сравнимо с умным или бездарным противником. Однако если считать, что эти случаи представляют собой крайности, то истинное поведение среды будет промежуточным и может быть охарактеризовано величиной .
При выборе коэффициента могут быть использованы эвристические методы, связанные с опытом и знанием ЛПР особенностей выбора средой своих состояний из множества
. Например, чем более сильными или убедительными доводами ЛПР являются соображения о принятии одного из крайних поведений среды, тем ближе будет к единице или нулю. Значение является равновесной точкой отрезка
238
[0, 1]. Для этого значения вполне естественно предполагать, что ЛПР считает cреду в равной степени и антагонистической, и максимально содействующей целям ЛПР. Также ЛПР могут быть рассмотрены различные системы разбиения отрезка [0, 1] значений на полную систему непересекающихся подмножеств с последующим заданием на них вероятностных отношений.
Полезным для выбора ЛПР значения может быть рассмотрение того, как меняются оптимальные решения при изменении от нуля до единицы с некоторым шагом. На основе полученного множества решений ЛПР может оценить последствия выбора различных , затем выбрать величину .
2.5.4.2. Критерий Ходжеса-Лемана
Критерий Ходжеса-Лемана позволяет использовать возможную информацию о распределении вероятности состояний среды, имеющуюся у ЛПР, и в то же время обеспечивает заданный уровень гарантированного выбора в случае, если эта информация неточная. Формально критерий Ходжеса-Лемана представляет собой комбинацию критерия Байеса-Лапласа и максиминного критерия Вальда.
Рассмотрим ситуацию принятия решений для функции
. Наилучшее решение
где — весовой коэффициент.
ЛПР пытается выбором весового коэффициента взвесить стремление выбрать решение с минимальным математическим ожиданием и учесть гарантированное наихудшее решение. Выбор ближе к единице будет отражать доверие ЛПР к значениям априорных вероятностей состояний среды и стремление в среднем получить наименьшие потери. При
239
выборе ближе к нулю ЛПР не доверяет априорной информации о поведении среды, стремится к осторожному поведению, готов получить не очень хороший, но гарантированный результат.
Для функции полезности наилучшее решение определяется из условия
2.5.5. Пример оценки отдельных характеристик качества информационной системы в условиях неопределенности
В качестве иллюстрации рассмотрим пример решения задачи выбора лучшего варианта информационной системы, оцениваемого по одному локальному критерию — среднему времени восстановления наиболее важных типовых трактов между отдельными элементами ИС. Для упрощения записи опустим в формулах нижний индекс , который указывает на номер локального критерия.
Пусть сравниваются четыре варианта ИС при пяти состояниях среды, описываемых уровнями загрузки
ИС , где соответствует низкому уровню загрузки ИС, – уровню ниже среднего, – среднему уровню,
– высокому уровню, – сверхвысокому уровню. Пусть задача решается при первой ситуации априорной информированности ЛПР: известно априорное распределение вероятностей , определенное на множестве состояний среды . Значения среднего времени восстановления для разных проектов ИС и состояний среды оценены экспертами и приведены в табл. 2.16.
240