- •4. Функции ценности, полезности и выбора
- •4.1Функции ценности
- •1.Проверка независимости
- •Критерии
- •4.2 Функция полезности
- •Аожидаемая полезность лотереи запишется как (4.6) Детерминированный эквивалент является решением уравнения (4.7)
- •Доказательство
- •Отсюда получим
- •4.3 Стохастическое доминирование
- •4.5 Функции выбора
- •5. Принятие решений в условиях многокритериальности
- •5.1 Источники многокритериальности в зпр в управлении экономикой
- •Пример процедуры - процедура Михайловского
- •Процедура Зайонца - Валлениуса
- •Метод электра.
- •5.Групповые решения
- •6. Нечёткие задачи оптимизации
Аожидаемая полезность лотереи запишется как (4.6) Детерминированный эквивалент является решением уравнения (4.7)
Определение.
ЛПР не склонен к риску, если предпочитает получить наверняка ожидаемый выигрыш в любой не вырождённой лотерее участию в этой лотерее:
.
(4.8)
Теорема 4.3 [2.,c.149]. Принимающий решение не склонен к риску тогда и только тогда, когда его функция полезности вогнута.
Доказательство.
Необходимость. Из (4.8) имеем: (для лотереи x1-p, x2-(1-p)). Тогда
u[px1 + (1-p)x2] > pu(x1) + (1-p)u(x2), для 0<p<1,
что есть определение строгой вогнутости
Достаточность. (Доказательство справедливо при конечном числе исходов).
Рассмотрим
произвольную лотерею
,
дающуюxi
c
вероятностью
pi,
i=
,где m
- число
исходов и где ни для одного i
неверно, что pi=1.
Тогда в силу строгой вогнутости u() имеем
,
что эквивалентно (4.8). (Условие х гарантируется выбором pi).
С
ледствие.
ЛПР, который предпочитает получение
наверняка ожидаемого выигрыша любой
лотереи 50-50 <х1,
х2>
участию в самой лотерее, не склонен к
риску.
Определение. Две функции полезности u1 и u2 стратегически эквивалентны (u1u2) тогда и только тогда, когда они одинаково упорядочивают по предпочтительности любые две лотереи. Мы уже видели (когда формировали вывод о том, что полезность есть количественная характеристика и измеряется в шкале интервалов), что если u1 = a+bu2, то u1u2. Центральное значение в ТП имеет тот факт, что верно и обратное.
Теорема 4.4. [2.,с.145]. Если u1u2 то a, b: u1(х) = a + bu2(x), x.
Доказательство
Пусть х[x,x*], причём х<x*,, x> (т.е. x*- с вероятностью , x- с вероятностью 1-). Эквивалентность установлена ЛПР. Отсюда:
ui(x)
= ui
(x*)
+ (1-)ui
(x),
i =
.
(4.9)
Положим в этом равенстве i=2, и решим полученное уравнение относительно :
.
Подставив теперь полученное значение в уравнение (4.9) при i=1:
и
окончательно имеем
,
что и требовалось доказать.
Мы уже ответили на вопрос о целях построения ФП и её единственности (по аналогии с тем, как это было сделано нами для ФЦ). Теперь обсудим, какими же свойствами должно обладать отношение предпочтений ЛПР, чтобы ФП существовала. Совокупность этих условий обычно называется аксиомами теории полезности. Они по-разному формируются различными авторами. В любом случае речь идёт о положениях, которые не могут быть доказаны математически внутри ТП, но могут быть в ряде случаев (возможно - косвенно) проверены экспериментально. Сформулируем эти аксиомы, следуя классической работе Льюса и Райфы [4].
Аксиома 1 Отношение предпочтения ЛПР (нестрогого) на множестве альтернатив полно.
Аксиома 2 (о приведении составных лотерей). Любая составная лотерея равноценна простой лотерее, имеющей исходы х1,х2, ... ,хn, вероятность которых вычисляется согласно обычным правилам теории вероятности:
если
L(i)
= (p
x1,
p
x2,
....., p
xn),
i = [1,s],
то
(q1L(1), q2L(2), ... , qsL(s)) (p1x1, p2x2, ... , pnxn), где
pi= q1pi(1) + q2pi(2) + ... + qspi(s).
Аксиома 3 (аксиома непрерывности). Всякий исход хi равноценен лотерее [(1-i)x1, ixn] (т.е. соответствующее значение i).
Аксиома 4 (аксиома эквивалентности). В любой лотерее входящий в неё с положительной вероятностью исход xi, можно заменить на эквивалентную ему лотерею [(1-i)x1, ixn].
Аксиома 5 (аксиома транзитивности). Отношение предпочтения на множестве альтернатив транзитивно.
Аксиома 6 (аксиома монотонности).
[px1,
(1-p)xn]
[p’x1,
(1-p’)xn]
p
p’
.
В этих предположениях справедлива следующая теорема 4.5.: Если отношение нестрогого предпочтения ЛПР удовлетворяет аксиомам 1-6, то числа ui для исходов xi: для двух лотерей: L(1) L(2), соотношение средних значений pi(1)ui и pi(2)ui отражает предпочтительность лотерей.
Интересной модификацией рассмотренных нами соотношений является ситуация, в которой ЛПР обладает некоторым начальным уровнем (благосостояния) [11]. Обозначим его w0. Введение этого параметра в анализ совершенно естественно: жизнь не начинается с нуля при принятии очередного решения и следует ожидать, что величина может повлиять на поведение ЛПР. Рассмотрим этот вопрос более подробно.
Напомним,
что детерминированный эквивалент
лотереи
мы определили соотношением:
.
Теперь это соотношение примет у нас такой вид:
.
Заметим, что w*=w0+x - это величина (важно, что не оценка!) благосостояния ЛПР после реализации лотереи, т.е. следствие этой лотереи. Поэтому и w* целесообразно представить в виде: w*=w0+pa.
Что же такое pa? Участие в лотерее для ЛПР эквивалентно получению w* наверняка, w0 у ЛПР уже есть (т.е. тоже наверняка!). Иначе говоря, возможность участия в лотерее увеличивает благосостояние ЛПР на pa. Теперь ясно, что, если ЛПР будет предложено продать своё право на участие в лотерее, то минимальная цена, за которую ЛПР согласен это сделать, равна как раз pa. Т.е. pa - продажная цена лотереи (отсюда и обозначение pa = asking price).
Рассмотрим теперь противоположную ситуацию. Пусть ЛПР предлагают не продать, а купить право на участие в лотерее. Какую максимальную цену он будет готов заплатить? У нас уже есть схема получения ответа на этот вопрос. Результат покупки лотереи (разумеется, случайный) для ЛПР имеет вид: w0+x-pb, (pb - цена покупки = «bid price» лотереи).
Ожидаемая полезность этого результата должна быть как минимум не хуже (не меньше) полезности первоначального состояния w0.
Получим:
.
Теперь поставим вопрос: как соотносится между собой рa и рb? Заметим, что при w0=0 мы получим такие соотношения:

Как видно, даже в этом, казалось бы, простейшем случае не вполне ясно соотношение рa и рb, т.е. выполняется ли интуитивно привлекательное предположение о том, что рa>рb.
Ответ на поставленный вопрос требует введения ряда новых понятий, к которым мы и переходим. Сейчас же лишь отметим, что возможно рa<0. Это означает, что ЛПР готов доплачивать за то, чтобы не участвовать в лотерее (по смыслу такое поведение ЛПР эквивалентно страхованию). Если рb<0, то величина рb есть компенсация ЛПР за принимаемый на себя риск.
Для решения вопроса о соотношении pa и pb нам понадобится еще одно понятие, впервые появившееся в знаменитых работах К.Эрроу и Дж.Пратта 64-65 годов. Повторим их рассуждения. Исходным пунктом возьмем уже знакомое нам уравнение для определения эквивалента и цены продажи:
.
Попробуем решить это уравнение относительно pa в общем виде, но приближенно, заменив выражение в левой и правой частях их аппроксимациями - разложениями в ряд Тейлора.
,
где
=E(x) - (эта величина предполагается известной).
Для аппроксимации подынтегрального выражения в правой части воспользуемся разложением в ряд Тейлора до второго порядка. Целесообразность такой несимметричной трактовки левой и правой частей определяется тем, что отдельные значения х будут заметно больше отклоняться от , чем pa от . Имеем:
Подставим
это выражение под интеграл в правой
части. Учтем, что при этом:

Уравнение наше примет такой вид:
,
отсюда

Примем pa- = . Имеем следующее соотношение
.
(4.10)
Выражение в квадратных скобках называется степенью абсолютной несклонности к риску (Aa). Отметим, что, если ЛПР нейтрален по отношению к риску (т.е. u - линейна), то Aa=0. Aa не меняется при произвольном линейном преобразовании функции полезности.
Теперь мы в состоянии доказать следующую теорему о соотношении pa и pb.
Теорема 4.6. [7].
Если абсолютная несклонность к риску есть убывающая функция своего аргумента, то либо 0<pb<pa, либо 0>pb>pa.
Если абсолютная несклонность к риску есть возрастающая функция, то либо 0<pa<pb, либо 0>pa>pb.
Если абсолютная несклонность к риску = const, то pa=pb.
Доказательство:
1). Докажем, если pа>0 pb>0. Из определений pa и pb имеем:
(4.11)
При этом, с учетом того, что pa и pb являются неявными функциями от начального уровня благосостояния и лотереи, мы можем записать
![]()
Если
pа>0,
то из возрастания функции полезности
по своему аргументу следует
,
а отсюда
.
Поскольку pb зависит от распределения х и для всех х при вычислении математического ожидания в правой части принимает одно и то же значение, то последнее неравенство возможно только при pb>0.
Лотерею в правой части уравнения (4.11) можно рассматривать как лотерею х для ЛПР с начальным уровнем благосостояния w0 - pb(w0,x). Запишем для нее уравнение для определения цены продажи.
![]()
![]()
Отсюда
.
Сопоставим
и
,
в предположении, что
.
Как мы уже знаем, при этом
,
т.е.
есть продажная цена лотереих
при начальном уровне благосостояния
меньшем,
чем w0.
Если абсолютная несклонность к риску
убывает, то
,
и таким образом
.
Другие части теоремы доказываются аналогично.
С концепцией компенсации за риск связано важнейшее, для рассматриваемой нами теории, понятие премии за риск. Формально определение таково. Премия за риск есть:
= E(x)-рa, (4.12)
т.е. разница между математическим ожиданием исхода и процентной ценой лотереи.
Справедлива следующая теорема 4.7. о премии за риск.
Если функция полезности ЛПР монотонно возрастает и выпукла вверх (вниз), то премия за риск даже этого ЛПР в любой лотерее положительна (отрицательна).
Доказательство этой теоремы основывается на т.н. лемме Енсена, которую мы приведём здесь без доказательства (далее E[] - символ оператора математического ожидания):
Если y есть случайная переменная и f(y)- строго выпуклая вверх функция, то
Е[f(y)]<f(E[y]).
Если же f(y) выпукла вниз, знак неравенства меняется на противоположный, т.е. Е[f(y)]>f[E(y)].
Итак, пусть функция полезности ЛПР u() монотонно возрастает и выпукла вверх. Тогда из неравенства Енсена получим:
[u(w0+x)]<u(E[w0+x]) = u(w0+E[x]).
Но для детерминированного эквивалента w*
u(w*)=E[u(w0+x)], отсюда u(w*)<u(w0+E[x]).
Поскольку u() монотонно возрастает, последнее возможно только при условии, что
w*<w0+E[x],т.е. w*-w0<E[x].
w*=w0+pa,
pa<E[x],т.е. >0.
Изучим теперь вопрос о том, чем определяется вид (или тип) функции полезности. Изложение будем вести на примере двухфакторных функций полезности. Обобщение на случай большого числа факторов очевидно.
Пусть
2 фактора y0
y
y*
и z0
z
z*.
Найдём для
лотереи 50-50
вида (y1,z0),(y2,z0)
детерминированный эквивалент вида
(
,z0).
Если
при этом не зависит отz0
(а зависит только от y1
и y2),
то говорят, что у
не зависит по полезности от z.
Иначе говоря, условные функции полезности u(,z0) и u(,z) стратегически эквивалентны. Из доказанной нами теоремы следует, что
u(y, z) = g(z) + h(z)u(y,z0). (4.13)
Это соотношение является ключевым для доказательства следующего положения о виде ФП:
Теорема 4.8. [2., c.225]. Если Y и Z взаимонезависимы по полезности, то ФП от двух аргументов Y и Z является полилинейной, т.е. может быть представлена в виде:
u(y, z) = u(y,z0) + ku(y,z0)u(y0,z)
или
u(y, z) = kyuy(y) + kzuz(z) + kyzuy(y)u2(z), где
1) u(y0,z0)=0, u(y*, z*) =1.
2) uy(y0)=0, uy(y*)=1.
uz (z0)=0, uz(z*)=1.
3) ky=u(y*; z0); kz=u(y0; z*); ky+kz+kyz=1.
Доказательство.
Из (4.13) при y=y0 получим: u(y0,z)=g(z)+h(z) u(y0,z0) т.е. u(y0,z)=g(z).
Поскольку g(z) и h(z) параметрически зависят от z0 и НЕ зависят от Y, то полученное выражение для g(z) можно использовать для вычисления u(y1,z), где y1y0:
u(y1,z)= u(y0,z)+h(z)u(y1,z0).
