Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Kurs_TPR.doc
Скачиваний:
13
Добавлен:
27.09.2019
Размер:
2.06 Mб
Скачать

Глава 3. Общая математическая теория принятия решений

Рассматривается элементарная теория принятия решений (ТПР) в условиях неопределенности и риска. Предполагается, что человек находится как бы в состоянии игры с природой. А так как природа не может быть сознательным противником, то критерий минимального гарантированного результата (критерий максимина) в ТПР не может иметь большого значения в отличие от теории игр. Этот критерий в игре с природой слишком пессимистичен [13].

Основное внимание будет уделено более реалистичному байесовскому подходу, который позволяет рассматривать процесс ПР как процесс обучения. Проведя достаточно большое число экспериментов и используя формулу Байеса, можно, хотя бы теоретически, сколь угодно точно оценить вероятности возможных состояний природы. А это ставит лицо, принимающее решение (ЛПР), в условия, близкие к достоверным.

Как уже отмечалось, принятие конкретного решения человеком в той или иной области базируется на его практическом опыте, знании существа дела, интуиции.

Математическая теория принятия решения – дополнительное средство, помогающее принимать решение. Полезность этой теории состоит в том, что она дает правильную ориентацию человеку, настраивает его на количественный лад. Она формализует процесс ПР, а это открывает большие возможности применения ЭВМ.

Наиболее важными особенностями ситуации ПР являются следующие:

  1. Наличие не менее двух взаимоисключающих вариантов, из которых должен быть выбран только один.

  2. Наличие критерия, позволяющего количественно оценивать имеющиеся варианты, и по этим оценкам осуществлять выбор.

Вопрос о критериях является наиболее сложным. Обычно трудно приписать каждому варианту определенное числовое значение. В большинстве практических случаев эти числовые значения можно задавать весьма приближенно и, к тому же, относительно.

Математическую теорию ПР можно рассматривать как часть математической статистики. Раздел «Теория статистической проверки гипотез» относится с точностью до терминов к ТПР. С другой стороны, ТПР можно рассматривать как часть теории исследования операций, поскольку в обеих теориях из множества вариантов согласно некоторому критерию выбирается наилучший.

Теория принятия решений, как и родственная ей теория игр, – раздел прикладной математики, в котором исследуется весьма широкий класс задач оптимизации. Центральное место в ТПР играют байесовские стратегии, позволяющие рассматривать процесс принятия решений как своеобразный обучающий процесс.

§1. Принятие решений в условиях неопределенности

Пусть имеется совокупность действий, операций

а1, а2, ..., аm, m  2, (3.1)

которые может совершить человек для достижения поставленной цели, причем одну и только одну операцию аi, i{1, 2, ..., m}, выбирает человек, принимающий решение.

Кроме того, представлен перечень объективных условий, например, состояний природы

Q1, Q2, ..., Qn, (3.2)

одно из которых Qj, j{1, 2, ..., n}, будет иметь место в действительности.

Для каждой операции аi, i = 1, 2, ..., m, при любом условии Qj, j = 1, 2, ..., n, задана полезность (выгода, доход) в некоторых единицах ij. Величины ij, играющие роль платежей в теории игр, обычно задаются из эвристических, субъективных соображений. При этом возникают специфические трудности при их числовой оценке, обусловленные такими факторами, как болезни, удовольствия, престиж, репутация и т.д. Величины ij можно задавать относительно, поэтому их называют показателями предпочтительности.

Все перечисленные условия, при которых принимается решение, представлены в табл. 3.1.

Таблица 3.1

Объективные

условия

Операции

Q1

Q2

Qn

a1

11

12

1n

a2

21

22

2n

am

m1

m2

mn

Если ЛПР не располагает никакой информацией о состояниях природы (3.2), то имеем ситуацию принятия решения в условиях неопределенности. Рассмотрим три известных подхода ПР в этой ситуации.

    1. Критерий максимина

Для каждой операции аi, i = 1, 2, ..., m, находим наихудший исход,

. (3.3а)

Затем определяется то значение i0, при котором величина максимальна,

. (3.3.б)

Принимаемое решение – выбор наилучшей операции из множества исходных (3.1). Равенства (3.3а), (3.3б) можно объединить в одно

. (3.4)

Рассмотренная операция максимин соответствует лучшему из худших исходов. Критерий максимина является чисто перестраховочным, поскольку природа не может быть сознательным противником. Максиминную операцию использует только крайний пессимист, не желающий идти ни на какой риск. Обычно такие люди довольствуются малым и предпочитают спокойную жизнь.

1.2. Критерий минимакса сожалений

Определение 3.1. Сожаление в ТПР – потери в результате упущенных возможностей.

Пусть природа находится в состоянии Qs, найдем максимальный элемент s-го столбца табл. 3.1,

.

Мера сожаления определяется как разность

где если если Тогда при состоя­нии природы Qs лучшей операцией является : для нее сожаление равно нулю. Изменяя последовательно значения s, s = 1,2,…, n, получим сожа­ление для каждой операции ai, i=1,2,…, m, при любом состояния природы Qs, s=1,2,…, n. Матрица сожалений представлена в табл. 3.2.

Для принятия решения к табл. 3.2 применяется критерий минимакса (minmax): для каждой операции ai, i=1,2,…, m, находится наибольшее со­жаление,

Таблица 3.2

Qj

ai

Q1

Q2

Qn

a1

11

12

1n

a2

21

22

2n

am

m1

m2

mn

Затем среди членов последовательности , i=1,2,…, m, s = 1,2,…, n, находится минимальный

Последние два равенства соединим в одно:

Принимаемое решение – наилучшая операция

1.3. Критерий равновозможных состояний

По этому критерию выбирается та операция ai0, для которой сумма полезностей

максимальна,

.

1.4. Решение конкретной задачи

Рассмотрим на конкретном примере принятие решений по трем описанным критериям. Пусть m=3, n=2 и матрица полезностей представлена в табл. 3.3.

Qs

a i

Q1

Q2

a1

1

11

a2

10

6

a3

0

14

Таблица 3.3

Q s

ai

Q1

Q2

a1

9

3

a2

0

8

a3

10

0

Таблица 3.4

Например, ai – i-й вариант технологического процесса для изготовле­ния некоторых изделий, Q1 – возникновение дефицита в ближайшие два года на сырье, из которого изготовляются детали, Q2 – отсутствие такого дефицита.

1. Применяя операцию максимина, получим

Максиминной операцией является операция а2, гарантирующая

6 единиц полезности.

2. Для использования критерия минимакса сожалений необходимо для данных табл. 3.3 найти матрицу сожалений. Сначала находим максимальный элемент каждого столбца этой таблицы:

Тогда матрица сожалений примет вид, представленный в табл. 3.4. Применяя к данным этой таблицы критерий минимакса, получим

max(9, 3) = 9, max(0, 8) = 8, max(10, 0) = 10, min(9, 8, 10) = 8.

Следовательно, операцией, соответствующей минимаксу сожалений, является операция а2.

3. По критерию равновозможных состояний для данных табл. 3.3 имеем

Аi = 1+11 = 12, A2 = 10+6 = 16, A3 = 0+14 = 14, .

состояний при­роды является операция а2. В рассмотренном примере все три критерия дали один и тот же ответ: операция а2 является оптимальной, она гарантирует 6 ед. полезности.

Если выбрать операцию а1, то в случае везения получим 11 ед. полез­ности, а в случае невезения – всего 1 ед. полезности. Если выбрать опера­цию а3, то в случае везения имеем 14 ед. полезности, а в случае невезения – 0 ед. полезности. Операция а2 гарантирует наибольшую полезность, 6 ед. Конкурирующие операции а1 и а3 гарантируют меньшие полезности: 1 ед. и 0 ед. соответственно.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]