Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Прикладная математика. Курсовик. Вариант 10.doc
Скачиваний:
17
Добавлен:
16.12.2013
Размер:
526.34 Кб
Скачать

Принятие решений в условиях неопределённости

3.1. Анализ связанного набора операций в условиях неопределенности

Предположим, что ЛПР (Лицо, Принимающее Решения) обдумывает четыре возможных

решения. Но ситуация на рынке неопределенна, она может быть одной из четырех.

С помощью экспертов ЛПР составляет матрицу последствий или доходов Q .

Элемент этой матрицы q[i,j] показывает доход, полученный ЛПР, если им

принято i-е решение, а ситуация оказалась j-я. В этой схеме полной

неопределенности могут быть высказаны лишь некоторые соображения о том, какое

решение принять. Сначала построим матрицу рисков. Строится эта матрица так: в

каждом столбце матрицы доходов находим максимальный элемент d[j] , после чего

элементы r[i,j]=d[j]-q[i,j] и образуют матрицу рисков. Смысл рисков

таков: если бы ЛПР знал что в реальности имеет место j-я ситуация, то он

выбрал бы решение с наибольшим доходом, но он не знает, поэтому, принимая

i-е решение он рискует недобрать d[j]-q[i,j] - что и есть риск.

Задана матрица последствий 4x4 из не более чем двузначных неотрицательных

чисел. Компьютер вычисляет матрицу рисков.

Матрица доходов Матрица рисков

│2 4 6 18│ │0 8 12 4│

│0 8 16 20│ │2 4 2 2│

│2 12 18 22│ │0 0 0 0│

│0 4 10 14│ │2 8 8 8│

Правило Вальда называют правилом крайнего пессимизма: ЛПР уверен, что какое-

бы решение он ни принял, ситуация сложится для него самая плохая, так что,

принимая i-е решение, он получит минимальный доход q[i]=min{q[i,j]:j=1..4}.

Но теперь уже из чисел q[i] ЛПР выбирает максимальное и принимает соответствующее решение.

По правилу Сэвиджа находят в каждой строке матрицы рисков максимальный

элемент r[i] и затем из чисел r[i] находят минимальное и принимают соответствующее решение. Так принимает решение ЛПР, не любящий рисковать.

По правилу Гурвица для каждой строки матрицы доходов находят величину

z[i]=a*max{q[i,j]:j=1..4}+(1-a)*min{q[i,j]:j=1..4}, потом находят из чисел

z[i] наибольшее и принимают соответствующее решение. Число a каждый ЛПР

выбирает индивидуально - оно отражает его отношение к доходу и риску, при

приближении a к 0 правило Гурвица приближается к правилу Вальда, при

приближении a к 1 - к правилу розового оптимизма, в нашем случае a равно 1/2.

Матрица доходов Матрица рисков

Вальд-► 2 2 │2 4 6 18│10.0 12│0 8 12 4│

0 │0 8 16 20│10.0 4 │2 4 2 2 │

2 │2 12 18 22│12.0 12.0 ◄-Гурвиц Сэвидж-► 0 0 │0 0 0 0 │

0 │0 4 10 14│ 7.0 8 │2 8 8 8 │

3.2.Анализ связанного набора операций в вероятностных условиях

Предположим, что ЛПР (Лицо, Принимающее Решения) обдумывает четыре возможных

решения. Но ситуация на рынке неопределенна, она может быть одной из четырех.

Однако в отличие от предыдущей опции известны вероятности этих ситуаций p[j].

Имея матрицу доходов Q теперь можно сказать, что доход от i-го решения

есть с.в. Q[i] с доходами q[i,j] и вероятностями этих доходов p[j].

Кроме того, риск i-го решения также есть с.в. R[i] с рисками r[i,j] и

вероятностями этих рисков p[j]. Математические ожидания с.в. Q[i], R[i]

называются также средним ожидаемым доходом и средним ожидаемым риском i-го

решения. Теперь можно принять решение (провести операцию), у которого наибольший средний ожидаемый доход, или наименьший средний ожидаемый риск. Вероятности p[j] - обыкновенные дроби вида 1/4 или 1/12.

матрица доходов доход средний ожидаемый риск матрица рисков

│2 4 6 18│ 6.8 6.4 │ 0 8 12 4 │

│0 8 16 20│10.4 2.8 │ 2 4 2 2 │

│2 12 18 22│13.2 ◄-max min-► 0.0 │ 0 0 0 0 │

│0 4 10 14│ 6.4 6.8 │ 2 8 8 8 │

── ── ── ── ── ── ── ──

1/5 2/5 1/5 1/5 1/5 2/5 1/5 1/5

вероятности ситуаций вероятности ситуаций

Для уточнения распределения вероятностей можно провести пробную операцию.

После ее проведения вероятности состояний, характеристики операций и оптимальные решения могут стать совершенно иными.

Жирным шрифтом выделены первоначальные характеристики, подчёркнутым - после проведения пробной операции. Подсчитаем, при какой максимальной

стоимости пробная операция еще оправдана, если решение принимать по критерию

максимального среднего ожидаемого дохода.

Первоначальные вероятности и характеристики операции

вероятности ситуаций вероятности ситуаций

1/5 2/5 1/5 1/5 1/5 2/5 1/5 1/5

доход средний ожидаемый риск ───

матрица доходов ▼ до пробной операции ▼ матрица рисков

│ 2 4 6 18 │ 6.8 16.4 3.6 6.4 │ 0 8 12 4 │

│ 0 8 16 20 │ 10.4 18.0 2.0 2.8 │ 2 4 2 2 │

│ 2 12 18 22 │ 13.220.00.00.0│ 0 0 0 0 │

│ 0 4 10 14 │ 6.4 12.6 7.4 6.8 │ 2 8 8 8 │

── ── ── ── ── ── ── ──

0.1 0.0 0.0 0.9 ▲ после операции ▲ 0.1 0.0 0.0 0.9

вероятности ситуаций вероятности ситуаций

3.3.Анализ по доходу и риску набора операций

Пусть имеем набор несвязанных друг с другом операций Q[i], i=1..n . Каждая

операция имеет два показателя: доход m[i] и риск r[i]. Скажем, что i-я операция

доминирует (превосходит) j-ю, если m[i]>=m[j] и r[i]<=r[j] и хотя бы одно из

этих неравенств строгое. При выборе наилучшей операции стараются, чтобы доход

был больше, а риск меньше, поэтому ни при каком разумном выборе доминируемая

операция не может быть выбрана. Остаются недоминируемые операции. Они называются оптимальными по Парето. Заданы характеристики 6-и операций. Жирным шрифтом выделены доминируемые операции и подчёркнутым - недоминируемые, т.е.

оптимальные по Парето. Ниже описано начало координат

плоскости (r,m) : риск - по горизонтали вправо, доход - по вертикали вверх.

Доход и риск операций

1 2 3 4 5 6

доход xx<=20 14 3 15 10 11 8

риск xx<80 9 20 11 8 71 68