- •Введение
- •Тема 1 математическое программирование и основные принципы исследования операций
- •Общая цель математического программирования
- •Основные этапы операционного исследования
- •Общая цель математического программирования
- •Основные особенности исследования операций
- •2. Основные этапы операционного исследования
- •1 Термин «математическое программирование» здесь неточен, его употребляют с учетом исторических причин и традиций.
- •Тема 2 Принятие решений у задачах исследования операций
- •Типичные классы задач исследования операций на транспорте
- •Некоторые принципы принятия решении в задачах исследования операций
- •Принятие решений в условиях определенности
- •Разработка математических методов решения задач, исследование операций на транспорте
- •Графаналитический метод
- •Симплексный метод
- •1.Общие понятия о симплексном методе
- •Тема 4 распределительный метод
- •1. Математическая модель и особенности транспортной задачи
- •2. Первый способ (метод Хичкока)
- •Сокращение количества промежуточных решений (итераций)
- •Тема 6. Транспортная сеть решение транспортных задач, имеющих некоторые дополнительные условия
Некоторые принципы принятия решении в задачах исследования операций
Теория принятия решений является фундаментом науки исследования операций. В процессе принятия решений возникают такие трудности:
1. Большое число критериев, которые не всегда согласованы между собой. Например, при проектировании нового устройства часто выдвигается требование максимальной надежности и минимальной стоимости изделия. Эти критерии являются противоречивыми, поэтому возникает задача компромисса между ними;
2. Высокая степень неопределенности, которая обусловлена недостаточной информацией для обоснованного принятия решений.
Элементы процесса принятия решений и классификация задач
Любой процесс принятия решений включает следующие элементы:
1. Цель. Необходимость принятия решений определяется целью или несколькими целями, которые должны быть достигнуты.
2. Лицо, принимающее решение, должно нести ответственность за последствия этих решений.
3. Альтернативные решения (различные варианты достижения целей).
4. Внешняя среда (совокупность всех внешних факторов, влияющих на исход решения).
5. Исходы решений.
6. Правила выбора решений (решающие правила).
Эти правила позволяют определить наиболее предпочтительное в смысле выбранного критерия решение.
Решающее правило отражает информированность лица, принимающего решение, о возможных исходах выбранных решений, а также предпочтительность тех или иных исходов. Итак, основой для построения решающих правил служит информация о предпочтении различных альтернатив для лица, принимающего эти решения.
Теория принятия решений использует различные процедуры, позволяющие формализовать предпочтения, т. е. выразить их в единой количественной мере. Основой для таких процедур является теория полезности, разработанная Дж. фон Нейманом и О. Моргенштерном 135]. Ее математическая основа — система аксиом, в которых утверждается, что существует некоторая мера ценности, позволяющая упорядочить результаты решений. Эта мера называется функцией полезности решений или полезностью [43].
В зависимости от условий внешней среды и степени информированности лица существует следующая классификация задач принятия решений: а) в условиях определенности, б) в условиях риска, в) в условиях неопределенности, г) в условиях конфликтных ситуаций или противодействия (активного противника).
Принятие решений в условиях определенности
Принятие решений в условиях определенности характеризуется однозначной или детерминированной связью между принятым решением и его исходом. Основная трудность — наличие нескольких критериев, по которым следует сравнивать исходы.
Здесь возникает задача принятия решений при так называемом «векторном критерии» [12].
Случай
1. Пусть имеется совокупность критериев:
Найти решение, которое окажется наилучшим в смысле выбираемого критерия.
Если все критерии измеряются в одной шкале, то обобщенный критерий F0 (x) можно записать в виде взвешенной суммы этих критериев
где w{ — вес соответствующего критерия.
В этом случае необходимо найти max F0 (x).
Если же эти критерии измеряются в различных шкалах, то необходимо привести их к одной шкале. Для этого формируют критерий
где
Следовательно, требуется свести к минимуму величину уклонения каждого критерия от его максимального значения.
При таком формировании обобщенного критерия возникает некоторое несоответствие, связанное с тем, что можно добиться высоких показателей по одним критериям за счет ухудшения показателей по другим. В этом случае значения некоторых частных критериев могут оказаться меньше предельно допустимых значений Fi (х) < Fi лоп.
Однако часто необходимо, чтобы выполнялось следующее условие:
Поэтому
можно предложить
еще
один способ образования обобщенного
критерия.
Допустим, что по каждому критерию определены предельные значения Fi доп, i = 1, n.
Если условие (3.3) выполняется, то можно принять fi (х) равным его собственному значению.
Если это условие не выполняется, то нужно принять Fi (х) = — ∞.
В таком случае задача сводится к нахождению
при
условии (3.3).
Случай 2. Предположим, что критерии упорядочены в последовательности F1, F2, ..., Fn.
Тогда задача отыскания оптимального решения может быть записана как
(3.5)
при
ограничениях:
Два варианта логического объединения критериев. Предположим, что критерии F1, F2, ..., Fn могут принимать только два значения 0 или 1.
Fi (x) = 1, если i-ая цель достигнута. В противном случае Ft (x) = 0.
Тогда обобщенный критерий может быть записан:
а) в виде конъюнкции критериев Fi, если общая цель операции состоит в выполнении всех целей одновременно, т. е.
б) в виде дизъюнкции критериев, когда общая цель операции достигается, если достигается хотя бы одна частная цель, т. е.
Методика определения полезности. Для принятия решений необходимо установить предпочтительность различных критериев (меру полезности тех или иных исходов) для Лица, принимающего решение.
Методика определения полезности возможных результатов разработана в [1].
Практическое применение теории полезности основывается на следующих аксиомах [43]:
1) Результат xi оказывается предпочтительнее хj (это записывается так: хi > xj), тогда и только тогда, когда и (хi) > и (хj), где и (хi) и и (хj) — полезности результатов хi и хj соответственно.
2) Транзитивность: если xi > хj, а хj > xk, то и (xi) > и (xk).
3) Линейность: если некоторый результат х представлен в виде х = (1 - k) x1 + +kх2 где 0 < k < 1, то и (х) = (1 — k) и (х 1) + ku (x2).
4) Аддитивность: если и (х1, x2 — полезность от достижения одновременно результатов х1 и х2, то свойство аддитивности следующее: и (х1, х2) = и (х1) + и (х2). Аналогично, если имеется п результатов, х1, х2, ..., хп, достигаемых одновременно, то
Рассмотрим несколько вариантов методики определения полезности в различных случаях.
Случай, когда имеются два результата.
Методика определения полезности такова:
1. Определяем, какой результат более предпочтителен для лица, принимающего решение. Пусть x1 > х2, т. е. х1 предпочтительнее, чем х2.
2. Затем определяем такую вероятность α, при которой достижение результата х1 будет эквивалентно результату х2, получаемому с вероятностью 1.
Таблица 1.1
3. Оцениваем соотношение между полезностями результатов х1 и х2. Для этого примем полезность
Тогда
II. Случай, когда имеются п возможных результатов х1 х2, ..., хп, между которыми установлено отношение предпочтения х1 > х2 > > х3 > ... > хп.
Для этого случая методика определения полезности следующая:
1. Определяем величину α1 из условия
2. Аналогично определяем
3. Положив полезность наименее предпочтительного результата хn равной единице, находим
III. Случай, когда некоторые критерии являются качественными. Применяется методика, основанная на алгоритме, предложенном Р. Акофом и Р. Черчменом [1].
Предположим, что имеется п результате» х1, х2, …, хп. Методика определения полезности состоит из следующих этапов:
1. Упорядочивают все результаты по убыванию предпочтительности. Пусть х1 — наиболее, а хn — наименее предпочтительный результат.
Составляют таблицу возможных комбинации результатов, достигаемых одновременно, и затем устанавливает их предпочтение относительно отдельных результатов х1, х2, ..., хn (табл. 1.1).
Эту информацию о предпочтительности результатов получают от экспертов.
2. Приписывают начальные оценки полезностям отдельных результатов и0(х1). и0(х2), .... и0(хn). Затем подставляют начальные оценки в последнее соотношение табл. 1.1. Если оно удовлетворяется, то оценки не изменяют.
В противном случае производят коррекцию полезностей так, чтобы удовлетворялось данное соотношение.
3. После этого переходят к следующему соотношению. Процесс коррекции продолжается до тех пор, пока не образуется система оценок и* (x1), и* (х2), .... и* (хn), которая будет удовлетворять всем указанным в таблице соотношениям. Коррекцию следует производить таким образом, чтобы по возможности изменять оценки для минимального количества результатов.
Пример 1.4. Пусть эксперт упорядочивает пять результатов х1,х2,…,х5, приписав им следующие оценки: и0 (х1) = 7; и0 (xz) = 4; ua (х3) = 2 и0 (х4) = 1,5 ио (х5) = 1.
Рассмотрев возможные варианты выбора, он высказал следующее суждение относительно ценности тех или иных комбинаций результатов.
1) х1 < х2 + х3 + х4 + х5,
2) х1<х2 + х3 + х4,
3) х1 < х2 + х3 + х5,
4) х1>х2 + х2,
5) x2<xa+xt + Xi,
6) х2 > х3 + х4,
7) х3 > х4 + х5.
Нужно произвести оценку полезности результатов, так чтобы удовлетворить всем неравенствам.
Подставляем начальные оценки в неравенство 7):
С
ледовательно,
неравенство 7) не удовлетворяется.
Изменяем
полезность результата х3
и
проверяем неравенство 6):
Это неравенство также не удовлетворяется.
Примем и1 (х2) = 5. При этом неравенство 5) удовлетворяется.
Обращаемся к неравенству 4);
Оно не выполняется.
Поэтому
примем
и1(x1)
— 8,5.
Теперь неравенства 3), 2), 1) удовлетворяются.
Проверяем еще раз неравенства 6) и 7) при измененных значениях полезностей: 5 > 3 + 1,5 и 3 > 1,5+ 1. Оба неравенства выполняются.
Выпишем окончательные оценки полезности результатов: u1 (х1) = 8,5; и1 (х2) = 5; и1 (х2) = 3; u1 (х4) = 1,5; и1 (x5) = 1.
Такая методика определения полезности применима, когда количество результатов п ограничено п < 6—7.
В случаях, когда п > 7, авторами предложена следующая модификация данной методики — способ коррекции оценок [1].
Множество результатов разбивают на подмножества, состоящие из 5—7 результатов и имеющие один общий результат, например, х1. Затем приписывают начальные значения полезностям для всех результатов, причем полезность общего результата х1 одинакова во всех подмножествах. Далее применяют способ коррекции оценок полезности независимо в каждом из подмножеств с ограничением и (х1) = const. В результате получают систему полезностей с единой мерой для всех подмножеств и (хi).
Принятие решений в условиях риска
Эта задача возникает в том случае, когда с каждой принимаемой стратегией ki связано целое множество возможных результатов О1,О2,..., От с известными вероятностями р (Oj/Хі).
Формально модель задачи может быть представлена в виде следующей матрицы:
L
=
г
де
lij
—
полезность результата
Оi
при использовании решения xi.
Пусть
заданы условные вероятности р
(Оj/хi),
j
= 1, т,
і
=
1,
п.
Вводят
ожидаемую полезность для каждой стратегии
Решающее правило для определения оптимальной стратегии xf записывают так:
Принятие решений в условиях неопределенности
Одним из определяющих факторов в таких задачах является внешняя среда или природа, которая может находиться в одном из состояний S1 ..., Sk, которые неизвестны лицу, принимающему решение (наблюдатель).
Тогда математическую модель задачи в условиях неопределенности можно сформулировать следующим образом.
Имеется некоторая матрица L размерностью т X п.
Элемент
этой матрицы lit
можно
рассматривать как полезность результата
Оj
при использовании стратегии xi
В зависимости от состояния среды результат Oj достигается с вероятностью р (Oj/ хі, Sk).
Кроме того, наблюдателю неизвестно распределение вероятностей р (Sj). Относительно состояния среды наблюдатель может высказывать определенные гипотезы. Его предположения о вероятном состоянии среды называются субъективными вероятностями р (Sk), k = 1, 2, ...., К.
Если бы величина р (Sk) была известна наблюдателю, то мы бы имели задачу принятия решений в условиях риска. В этом случае решающее правило xі определяется следующим образом:
На самом деле состояния среды неизвестны и неизвестно также распределение вероятностей р (Sk).
Как выбрать при этом оптимальную стратегию?
Существует несколько критериев для выбора оптимальной стратегии.
Критерий Вальда (критерий осторожного наблюдателя). Этот критерий оптимизирует полезность в предположении, что среда находится в самом невыгодном для наблюдателя состоянии. По данному критерию решающее правило имеет следующий вид:
г
де
По критерию Вальда выбирают стратегию, которая дает гарантированный выигрыш при наихудшем варианте состояния среды.
Критерий Гурвица основан на следующих двух предположениях: среда может находиться в самом невыгодном состоянии с вероятностью 1 — а й в самом выгодном — с вероятностью а, где а — коэффициент доверия.
Т
огда
решающее правило записывается так:
Если α= 0, получаем критерий Вальда.
Если α = 1, то приходим к решающему правилу вида max max и (xt Sk), так называемая стратегия «здорового оптимиста», Хi Sk который верит в удачу.
Критерий
Лапласа.
Если неизвестны состояния среды, то
все состояния среды считают
равновероятными:
В результате решающее правило определяется соотношением (3.11) при условии р (Sk) — -т?-'
Критерий Сэвиджа (критерий минимизации «сожалений»). «Сожаление» — это величина, равная изменению полезности результата при данном состоянии среды относительно наилучшего возможного решения.
Чтобы определить «сожаление», поступают следующим образом. Строят матрицу
В
каждом столбце этой матрицы находится
максимальный элемент
Его вычитают из всех элементов этого столбца. Далее строим матрицу «сожалений»
Искомую стратегию хi, которая минимизирует «сожаление», определяют из условия
(3.15)
Этот критерий минимизирует возможные потери при условии, что состояние среды наихудшим образом отличается от предполагаемого.
Рассмотрим частный случай предложенной выше модели задачи в условиях неопределенности.
Предположим, что каждому возможному состоянию среды соответствует один возможный исход:
где
Таким образом, в данном случае математическая модель задачи принятия решений определяется множеством стратегий X = {хi}, множеством состояний среды S ={Sκ}, а также следующей матрицей:
где lij = u(xi, Sj).
Множество {р (Sj)} предполагается неизвестным.
В этом случае критерии для выбора оптимальной стратегии имеют следующий вид:
Критерий Вальда
К
ритерий
Гурвица
К
ритерий
Лапласа
К
ритерий
Сэвиджа:
