Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Methodical Instructions / Учебные пособия / Учебное пособие МПР (2002).doc
Скачиваний:
165
Добавлен:
19.04.2013
Размер:
869.89 Кб
Скачать

4.2 Функция полезности

Сразу обозначим область нашего дальнейшего анализа: это задача принятия решения (ЗПР) в условиях риска (в отличие от ФЦ, которая является ЗПР в условиях определенности). Более конкретно, мы переходим к рассмотрению следующей ЗПР:

Имеется совокупность альтернатив (действий) – а, a, ... и совокупность исходов: x1, .... xn, причём исходы перенумерованы так, что x1 x2x3 ... xn, где - символ бинарного отношения «хуже».

Если бы каждое действие приводило ко вполне определенному последствию (исходу), то проблема выбора наилучшего действия при наличии данной ранжировки исходов не стояла бы. Однако в наших условиях каждому действию а соответствует лишь определённое распределение вероятностей на множество исходов. Какое действие выбрать? Так называемая «классическая теория полезности», разработанная фон Нейманом и Моргенштерном, предлагает следующий путь:

Допустим, i ЛПР оценивает как эквивалентные 2 такие альтернативные возможности:

1.Получить xi наверняка (т.е. с вероятностью 1).

2.Получить xn (лучший исход) с вероятностью i и xi (худший) с вероятностью 1-i,

т.е. мы каким то образом, на основе анализа систем предпочтений ЛПР подобрали такие значения i. Если ЛПР действует разумно и последовательно (говорят, что его поведение является согласованным), то, очевидно n=1, 1=0 и, кроме того,

1 2  n

Таким образом, каждому исходу xi поставлена в соответствие некоторая числовая оценка i, называемая его полезностью.

Сравним теперь 2 альтернативы (действия) a и а, порождающие вероятности pi и pi соответственно на множестве исходов {xi}. Подсчитаем величины:

и ,

которые естественно называть оценками ожидаемой полезности в случае выбора каждой из альтернатив. ТП утверждает, что следует выбрать ту альтернативу, у которой ожидаемая полезность - больше. Обоснование таково. Действия а эквивалентны представлению ЛПР шансов захn и шансов заx1. Аналогично для а.

Заметим также, что если преобразовать i в ui при помощи положительного линейного преобразования

ui = a + bi, b>0,

то

,

т.е. оценка ui будет точно так же упорядочивать альтернативы по ожидаемой полезности. Если же сделать произвольное монотонное преобразование, то упорядочение нарушится, стало быть, полезность, в отличие от ценности, - есть качественный показатель и измеряется в шкале интервалов.

Теперь мы в состоянии дать определение ФП: это такая функция u(x), что u(x)=полезность x, x.

Важнейшими в теории полезности являются понятия монотонности, лотереи, детерминированного эквивалента.

Одномерная ФП называется монотонно возрастающая, если x1>x2 u(x1) u(x2).

Под лотереей в теории полезности понимается ситуация, в которой исход x1 возможен с вероятностью p1, x2 - p2 и т.д.

Детерминированным эквивалентом лотереи называется величина такая, что ЛПР безразлично в выборе между участием в лотерее и получениемнаверняка. Заметим, что лотереи с двумя исходами уже были предметом нашего анализа.

Ожидаемый выигрыш в лотерее: . (4.3)

Ожидаемая полезность лотереи: . (4.4)

Если возможность выигрыша лотереи описывается плотностью распределенияf, то ожидаемый выигрыш в лотерее равен: (4.5)