Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТПР2009.DOC
Скачиваний:
33
Добавлен:
24.09.2019
Размер:
2.1 Mб
Скачать

4.2.2. Метод Сэвиджа (метод матрицы сожалений)

Процедура поиска решения методом Севиджа сводится к следующему:

. 1. Предположим, что наступит состояние среды, соответствующее первому столбцу. Подсчитаем потери дохода, которые могут возникнуть при выборе каждой альтернативы. Если мы выберем альтернативу с наибольшим значением дохода, потерь не будет. Для каждой из остальных, неоптимальных альтернатив потери дохода равны разности между максимальным доходом для лучшей альтернативы и доходом для рассматриваемой альтернативы. Аналогичные операции выполняем для всех столбцов. Таким образом, в каждом столбце таблицы решений определяем наибольший элемент и вычитаем из него значения остальных элементов этого столбца, т. е. получаем новую таблицу. Эту операцию можно описать формулой

Данную формулу можно трактовать как потери дохода, которые могут возникнуть, если мы выберем неоптимальную альтернативу. Пересчитанная таблица называется матрицей сожалений о возможных потерях дохода, то есть об упущенной выгоде. Упущенная выгода, сожаление о возможных потерях равны нулю для альтернативы с максимальным доходом. Для других альтернатив упущенная выгода равна разнице между максимальным возможным доходом и полученным при выборе данной альтернативы.

Сравним позиции ЛПР в методах максимина и Севиджа. ЛПР, пользующееся методом максимина, стремится как можно больше гарантированно выиграть, получить гарантированный наибольший выигрыш. ЛПР, пользующееся методом Севиджа, стремится как можно меньше потерять, получить наименьший проигрыш в доходе из всех возможных (наименьшее сожаление об упущенной выгоде). Эти разные позиции, вообще говоря, могут привести к выбору разных оптимальных альтернатив.

2. Далее, в соответствии с гипотезой об антагонизме, предполагающей, что среда будет вести себя по отношению к ЛПР самым "подлым" образом, то есть будет максимизировать сожаление ЛПР об упущенной выгоде, определяем в каждой строке полученной матрицы сожалений максимальный элемент, т. е. наибольшее сожаление, гарантирующее, что больших сожалений о возможных потерях дохода, чем выбранное сожаление, не будет. Эта операция взятия максимума по столбцам j в i-той каждой строке записывается в виде:

В результате получаем столбец наибольших сожалений о потерянной выгоде

3. Из полученных наибольших сожалений определяем наименьшее, соответствующее выбору наилучшей альтернативы, т. е. находим минимаксное значение

Пример:

Используя вышеописанный пример (п. 4.1), строим матрицу сожалений об упущенной выгоде и записываем столбец наибольших сожалений для каждой альтернативы:

решение

Наименьшие гарантированы потери получаются при выпуске зонтиков (в отличие от плащей в методе гарантированного выигрыша).

4.2.3. Метод Гурвица

Критерий принятия решения формируется в этом методе следующим образом:

С - коэффициент, выбираемый ЛПР:

Если C=1, то получаем максиминный критерий; если C=0, то получаем критерий оптимиста, азартного игрока, который полагает, что среда будет вести себя наилучшим для него образом. Промежуточные значения C позволяют сделать “мягкий” выбор между наименьшим, но гарантированным выигрышем и наибольшим, но маловероятным. Выбор С=0 соответствует оптимистическому взгляду ЛПР, полагающему, что ему должно повезти и он получит максимальный возможный доход. Такой взгляд характерен для холерического склада психики. Выбор 0 < C < 0,5 соответствует ЛПР-сангвинику, выбор 0,5 < C < 1 – ЛПР-флегматику, выбор С=1 – ЛПР-меланхолику, считающему, что всё будет складываться самым худшим для него образом, что соответствует "закону подлости". Поскольку строго обосновать выбор конкретного численного значения C трудно, обычно принимают C=0.5 .

Пример:

Выберем С=0.5 для вышеописанного примера. Тогда получим

решение