Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Optimizatsia_upravlencheskikh_resheny_Yarygin.doc
Скачиваний:
3
Добавлен:
01.03.2025
Размер:
10.06 Mб
Скачать

6.3. Принятие решений в условиях неопределенности

Методы принятия решений в условиях риска разрабатывают­ся и обосновываются в рамках так называемой теории статисти­ческих решений. При этом в случае стохастической неопределенности, когда для состояний окружающей среды заданы вероятности (заданные экспертно или вычисленные на основании статистических данных), решение принимается на основе критерия максимума ожидаемого среднего выигрыша или минимума ожи­даемого среднего риска.

Применение каждого из перечисленных критериев требует описания матрицы платежей (выигрышей), отражающей результат альтернативных воздействий (принятых решений) в зависимости от состояния природы. Матрица платежей V с m возможными решениями при n возможных состояниях природы представим в следующем виде:

Таблица 6.2. Матрица платежей V

V

s1

s2

sn

a1

v11

v11

v1n

a2

v21

v22

v1n

am

vm1

vm2

vmn

где a1 , …, am – возможные решения, s1 , …, sn – возможные состояния природы, vij= v(ai,sj ) – плата, получаемая в случае принятия решения ai,в ситуации sj.

Если для такой «игры с природой», задаваемой платежной матрицей V, стратегиям природы sj соответствуют вероятности рj, то лучшей стратегией, выбираемой ЛПР, будет стратегия, обеспечивающая максимальный ожидаемый (средний) выигрыш, т.е.

(6.1)

Применительно к матрице рисков R= ||rij||m,n (матрице упущенных вы­год) лучшей будет та стратегия игрока, которая обеспечивает ему минимальный средний риск:

(6.2)

Матрица рисков R вычисляется по матрице V следующим образом:

Например для матрицы платежей

(6.3)

матрица рисков будет иметь вид

(6.4)

Заметим, что когда говорится о среднем выигрыше или риске, то подразумевается многократное повторение акта принятия решений. Условность предположения заключается в том, что реально требуемого количества повторений чаще всего может и не быть.

На практике целесообразно принимать решение по матрице выигрышей (6.1) или матрице рисков (6.2) в зависимости от того, какая из них определяется с большей достоверностью. Это особенно важно учитывать при экспертных оценках элементов матриц V и R.

6.3.1. Критерии выбора альтернативных решений

Неопределенность, связанную с отсутствием информации о вероятностях состояний окружающей среды (природы), называют «безнадежной». В таких случаях для определения наилучших решении используются критерий Лапласа, критерий «максимакса», критерий Вальда, критерий Сэвиджа и критерий Гурвица. Перечисленные критерии отличаются характерной степенью оптимизма для ЛПР.

Критерий Лапласа основан на принципе недосточного основания, который состоит в том, что, если распределение вероятностей ситуаций p(sj) неизвестно, то нет основания считать их различными. Таким образом, используется оптимистическое предположение, что p1=p2=…=pn=1/n. Следовательно, лучшим решением ai будет решение, при котором достигается максимум критерия:

.

Критерий максимакса определяет стратегию принятия решения, максимизирующую максимальные выигрыши для каждой ситуации (состояния природы). Этот критерий отличается крайним оптимизмом. Наилуч­шим признается решение, при котором достигается максимальный выигрыш, равный .

Следует отметить, что ситуации, требующие применения такого критерия, в экономике в общем нередки, и пользуются им не только сверхоптимисты, но и ЛПР, поставленные в безвыходное положение, когда они вынуждены руководствоваться принципом «все или ничего».

Максиминный (минимаксный) критерий Вальда выбирает решение, для которого достигается значение . ЛПР руководствующийся данным критерием рассматривает окружающую среду как агрессивно настроенного и сознательно действующего противника и выбирает стратегию, дающую наилучший результат при реализации наихудших вариантов каждого из решений.

Для платежной матрицы (6.3) критерий Вальда дает следующие варианты наихудших значений:

i=1, ;

i=2 , ;

i=3, .

Тогда искомый максимум достигается при выборе второго решения a2 .

В соответствии с критерием Вальда из всех самых неудачных результатов выбирается лучший (W = 3). Такая перестраховочная позиция крайнего пессимизма рассчитана на худший случай. Эта стратегия принятия решения приемлема, например, когда ЛПР не столько стремится к крупному выигрышу, сколько хочет застраховаться от большого проигрыша.

Критерий минимаксного риска Сэвиджа производит выбор стратегии аналогично выбору по критерию Вальда, но ЛПР руководствуется не матрицей платежей V, а матрицей рисков R, и производит выбор, минимизируя максимальный риск:

Для матрицы рисков (6.4) критерий Сэвиджа дает:

i=1 ;

i=2 ;

i=3 .

Минимально возможный из самых крупных рисков S = 1, достигается при принятии решения а2.

Критерий Гурвица рекомендует при выборе решения ориентироваться на некоторый усредненный результат. Такой подход характеризуется промежуточной склонностью ЛПР к риску между крайним пессимизмом (боязнью риска) и безудержным оптимизмом (безоглядный риск). Согласно критерию Гурвица предпочтительное решение выбирается по матрице V так, чтобы было достигнуто максимальное значение средневзвешенного выигрыша H:

Параметр р – показатель степени оптимизма ЛПР. При p = 0 критерий Гурвица совпадает с максимаксным критерием, а при р = 1 - с критерием Вальда. Покажем процедуру применения данного критерия для матрицы V (6.3) при р = 0,5:

Тогда , т.е. оптимальным является решение а2.

Применительно к матрице рисков R критерий Гурвица имеет вид:

При р = 0 выбор стратегии игрока 1 осуществляется по условию наименьшего из всех возможных рисков ( ); при р = 1 - по критерию минимаксного риска Сэвиджа.

В случае, когда по принятому критерию рекомендуется к использованию несколько стратегий, выбор между ними может делаться по дополнительному критерию, например в расчет могут приниматься средние квадратичные отклонения от средних вы­игрышей при каждой стратегии. Еще раз подчеркнем, что здесь стандартного подхода нет. Выбор может зависеть от склонности к риску ЛПР.

В заключение приведем результаты применения рассмотренных выше критериев на примере следующей матрицы выигрышей:

A

B

C

D

E

F

G

H

I

J

K

1

V

s1

s2

s3

s4

Макси

макс

Лаплас

Вальд

Сэвидж R

Грувиц

р_

Гурвиц

2

a1

20

30

15

15

30

20

15

55

18,75

0,75

3

a2

75

20

35

25

75

38,75

20

40

33,75

4

a3

25

60

25

25

60

33,75

25

50

33,75

5

a4

5

5

45

5

45

15

5

70

15

6

макс

75

60

45

25

75

38,75

25

40

33,75

7

а2

а2

а3

а2

а2

8

9

R

s1

s2

s3

s4

max r ij

10

a1

55

30

30

10

55

11

a2

0

40

10

0

40

12

a3

50

0

20

0

50

13

a4

70

55

0

20

70

Рис. 6.2. Модель принятия решений в условиях неопределенности

Модель для выбора решений представлена на рис. 6.2. В соответствие с полученными значениями критериев ЛПР может принять следующие решения:

по критерию Лапласа – а2,

по критерию максимакса – а2.

по критерию Вальда – а3,

• по критерию Сэвиджа – а2,

• по критерию Гурвица (при р = 0,75) – а2.

Таким образом, в случае отсутствия информации о вероятностях состоянии среды теория не дает однозначных и математически строгих рекомендации по выбору критериев принятия решений. Это объясняется в большей мере не слабостью теории, а неопределенностью самой ситуации. Единственный разумный выход в подобных случаях - попытаться получить до­полнительную информацию, например, путем проведения ис­следований или экспериментов. В отсутствие дополнительной информации принимаемые решения теоретически недостаточно обоснованы и в значительной мере субъективны (хотя бы из-за склонности ЛПР к оптимизму или пессимизму). Не смотря на то, что применение математических методов в «играх с природой» не дает абсолютно достоверного результата и последний в определен­ной степени является субъективным (вследствие произвольно­сти выбора критерия принятия решения), оно создает некоторое упорядочение и структурирование данных, имеющихся в распоряжении ЛПР: задаются множество состояний окружающей среды, множестово альтер­нативных решений, определяются выигрыши и потери при различных сочета­ниях системы «среда - решение». Такое структурирование знаний об исследуемой проблеме способствует повышению качества принимаемых решений.

Задание.

Построить электронную таблицу (рис. 6.2), задав соответствующие формулы для ячеек F6-J6, в которых получаются значения критериев, используя промежуточные вычисления максимумов и минимумов по строкам матрицы V (диапазон B2:E5), а также для вычисления матрицы R (диапазон B10:E13). Обеспечить отображение выбираемых решений в ячейках F7-J7.

Для демонстрации зависимости критерия Гурвица от значения «показателя оптимизма» p, включить в модель элемент управления «линия прокрутки», обеспечивающий изменение параметра р от 0 до 1 с шагом 0,01.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]