Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Мет. опт. решений, пособие.doc
Скачиваний:
204
Добавлен:
22.03.2016
Размер:
5.2 Mб
Скачать

Глава 5. Принятие решений в условиях неполной информации

При принятии решений в условиях неполной информации, большая ответственность ложится на лицо принимающее решение (ЛПР), так как окончательный выбор оптимального решения на основе поставленной цели зависит от точки зрения ЛПР.

Принятию решения обычно предшествует количественный анализ, при котором определяются возможные варианты решения проблемы, возможные исходы каждого решения и их оценка.

Критерии принятия решений в рассматриваемых задачах делятся на две группы:

 без использования численных значений вероятностей исходов, то есть в условиях стохастической неопределенности;

 с использованием численных значений вероятностей исходов, когда параметры модели считаются случайными величинами с известными законами распределения, то есть в условиях риска.

Такие задачи относят к теории игр и называют также играми с природой, где один игрок — лицо принимающее решение, а второй — внешние факторы или обстоятельства, к которым можно отнести и погоду.

5.1. Принятие решений в условиях стохастической неопределенности

Принятие решения в условиях стохастической неопределенности можно описать с помощью матрицы «выигрышей» (или «потерь») c m возможными действиями (стратегиями) иn возможными случайными состояниями природы , которая имеет вид:

,

где представляется как выигрыш (потеря), связанный с-ой стратегией ЛПР (игрока) и-м состоянием природы.

При решении задач наряду матрицами рассматривают соответствующие таблицы:

Таблица 5.1. Исходная матрица в условиях неопределенности

Для используют также термин: «полезность» принятого решения.

Таким образом, требуется найти вектор , который обеспечивает оптимум заданной функции полезностипо некоторому критерию.

В условиях неопределенности вероятностное распределение, соответствующее состояниям природы, не известно. Поэтому выбор стратегии игроком принимается на основе ряда критериев:

  1. Критерий Лапласа.

  2. Максиминный (минимаксный) критерий.

  3. Максимаксный критерий.

  4. Критерий Гурвица.

  5. Критерий Сэвиджа.

Критерий Лапласа опирается на следующее соображение: так как распределение вероятностей состояний среды неизвестно, можно считать их равными, то есть .

Выбор наилучшей стратегии выбирается на основе критерия максимизации выигрыша, если задает выигрыш:

, (5.1)

или минимизации потерь, если задает потерю:

, (5.2)

Пример T578. Хенк — прилежный студент, который обычно получает хорошие отметки благодаря, в частности, тому, что имеет возможность повторить материал в ночь перед экзаменом. Перед завтрашним экзаменом Хенк столкнулся с небольшой проблемой. Его сокурсники организовали на всю ночь вечеринку, в которой он хочет участвовать. Хенк имеет три альтернативы: — участвовать в вечеринке всю ночь;— половину ночи участвовать в вечеринке, а половину — учиться;— учиться всю ночь.

Профессор, принимающий завтрашний экзамен, непредсказуем, и экзамен может быть легким (), средним () или трудным (). В зависимости от сложности экзамена и времени, затраченного Хенком на повторение, можно ожидать следующие баллы.

85

60

40

92

85

81

100

88

82

Порекомендуйте Хенку, какой выбор он должен сделать.

Решение. Очевидно, что в данном случае необходимо воспользоваться формулой (5.1), чтобы максимизировать полученный балл. Рассчитаем ожидаемые значения баллов для каждого решения (стратегии):

балла,

баллов,

балла.

М

85

60

40

62

92

85

81

86

100

88

82

92

Лаплас рекомендует учиться всю ночь.

Максиминный (минимаксный) критерий называют еще критерием Вальда, или критерием «осторожного наблюдателя», так как предполагается, что внешняя среда находится в самом невыгодном положении. Поэтому критерий сводится к выбору наилучшей альтернативы из наихудших, если задает прибыль (максиминный критерий):

, (5.3)

или к выбору наихудшей альтернативы из наилучших, если задает потери (минимаксный критерий):

, (5.4)

Применим критерии к предыдущей задаче.

85

60

40

40

92

85

81

81

100

88

82

82

, критерий предлагает стратегию , оценивая при этом шансы Хенка, как получение 82 баллов, при условии, что он будет учиться всю ночь.

Максимаксный критерий называют также критерием «здорового оптимиста», так как предполагается, что внешняя среда находится в самом выгодном положении. Поэтому критерий сводится к выбору наилучшей альтернативы из наилучших, если задает выигрыш:

, (5.5)

Применим критерий к предыдущей задаче.

85

60

40

85

92

85

81

92

100

88

82

100

, критерий предлагает стратегию , оценивая при этом шансы Хенка, как получение 100 баллов, при условии, что он будет учиться всю ночь.

Критерий Гурвица предполагает, что внешняя среда может находиться в наилучшем состоянии с вероятностью , а в наихудшем состоянии с вероятностью, где.

Если задает выигрыш, тогда решение по критерию Гурвица производится по условию:

, (5.6)

Если задает потери, тогда решение по критерию Гурвица производится по условию:

, (5.7)

Параметр называютпоказателем оптимизма, так как выбором параметра можно задавать степень оптимизма. При критерий Гурвица переходит в критерий оптимиста, а при— в критерий пессимиста.

Рассмотрим решение предыдущей задачи с уровнем оптимизма . Ожидаемое значения баллов для стратегии:

.

Аналогично рассчитаем значения для остальных стратегий. Для сравнения приведем результаты расчетов при различных :

85

60

40

76

62,5

49

92

85

81

89,8

86,5

83,2

100

88

82

96,4

91

85,6

max:

96,4

91

85,6

Наилучшим решением и для данного критерия является .

Критерий Сэвиджа строится на основе матрицы «потерь» , которая получается из матрицы платежей (выигрышей или проигрышей) следующим образом:

Построим матрицу потерь для рассматриваемого выше примера. В данном случае задает выигрыш. Поэтому найдеммаксимальные значения по столбцам:

85

60

40

92

85

81

100

88

82

max

100

88

82

Вычтем полученные числа 100, 88, 82 из элементов соответствующих столбцов, получим матрицу потерь:

15

28

42

8

3

1

0

0

0

max

100

88

82

К полученной матрице применяется минимаксный критерий:

,

что соответствует решению .