
- •По курсу
- •Для студентов специальности 080801
- •Таганрог 2007
- •1. Линейное программирование (лп)
- •1.1. Формы представления задач лп
- •1.2. Графический метод решения задачи лп
- •1.3. Симплекс-метод решения задачи лп
- •1.4. Двойственные задачи лп
- •1.5. Транспортная задача
- •2. Некоторые принципы принятия решений в задачах исследования операций
- •2.1. Задачи принятия решений. Определение
- •Полезности
- •2.2. Однокритериальные задачи принятия решений
- •2.3. Многокритериальные задачи принятия решений
- •3. Игровые методы принятия решений
- •3.1. Игры в матричной форме. Решение матричных антагонистических игр в чистых стратегиях
- •3.2. Решение матричных антагонистических игр в смешанных стратегиях
- •3.3. Игры в позиционной форме
- •3.4. Неантагонистические игры (некооперативный вариант)
- •4. Модели управления запасами
- •4.1. Детерминированные статические модели
- •4.2. Детерминированные динамические модели
- •Библиографический список
- •Содержание
- •1.1. Формы представления задач лп……………..………….……..3
- •Математические методы и модели исследования операций
2.2. Однокритериальные задачи принятия решений
Детерминированные и неопределенные задачи принятия решений можно считать предельными случаями вероятностных задач. В силу этого рассмотрим сначала вероятностные задачи, а затем детерминированные и неопределенные.
Для описания вероятностных задач удобно использовать матрицы, в которых каждый столбец определяет возможный результат, а каждая строка – возможную стратегию.
Элементы uij матрицы определяют полезности результатов Oj при стратегиях ci, т.е.
а элементы pij – вероятности получения результатов Oj при стратегиях ci, т.е.
Матрица такого вида называется платежной матрицей.
Для использования основных критериев (в частности критерия максимума математического ожидания полезности) результаты следует задавать так, чтобы они образовывали полную группу несовместных событий. Если это условие не выполняется, то, используя булево разложение, можно получить составные результаты, удовлетворяющие указанному требованию. Так, например, если имеется два результата Q1 и Q2, не образующие полной группы несовместных событий, то можно образовать четыре составных результата, обладающих этим свойством:
O1: имеют место Q1 и Q2;
O2:
имеет место Q1,
но не Q2
(Q1
и
);
O3:
имеет место Q2,
но не Q1
(
и Q2);
O4: не имеют места ни Q1, ни Q2 ( и ).
Математическое ожидание полезности i-й стратегии определяется следующим образом:
В большинстве вероятностных задач для выбора стратегии обычно применяется критерий максимума математического ожидания полезности. Согласно этому критерию необходимо выбрать такую стратегию c*, которая обеспечивает максимум M* математического ожидания полезности, т.е.
Чаще всего эта
задача решается простым перебором
значений
для всех ci
(особенно, если число n
строк платежной матрицы невелико).
Детерминированную задачу можно рассматривать как предельный случай вероятностной задачи, когда для каждой стратегии вероятность получения одного из возможных результатов равна 1, а вероятности получения остальных результатов равны 0.
Для выбора стратегии применяется критерий максимума полезности. Согласно этому критерию необходимо найти такую стратегию c*, которая приводит к результату, имеющему максимальную полезность, т.е.
где
при
Одним из определяющих
факторов в неопределенных задачах
является внешняя среда (природа), которая
может находиться в одном из состояний
θl,
с вероятностью p(θl).
В зависимости от состояния θl
среды результат Oj
реализации стратегии ci
достигается с вероятностью
,
т.е. каждому результату при фиксированной
стратегии соответствует не одна, как
ранее, а L
вероятностей.
Математическое ожидание полезности i-й стратегии в данном случае определяется следующим образом:
,
где
− математическое ожидание полезности
i-й
стратегии при l-м
состоянии внешней среды.
Платежная матрица в данном случае имеет размер m×L, каждый столбец матрицы определяет возможное состояние внешней среды, каждая строка – возможную стратегию.
|
ci |
θ1 |
θ2 |
… |
θL |
|
c1 |
u11 |
u12 |
∙∙∙ |
u1L |
U = |
c2 |
u21 |
u22 |
∙∙∙ |
u2L |
|
∙∙∙ |
∙∙∙ |
∙∙∙ |
∙∙∙ |
∙∙∙ |
|
cm |
um1 |
um2 |
∙∙∙ |
umL |
Элементы uil матрицы определяют полезность, обеспечиваемую стратегией ci при состоянии среды θl,т.е.
Проблема выбора оптимальной стратегии заключается в том, что вероятности P(θl), не известны ЛПР. Для выбора оптимальной стратегии используются несколько критериев.
Методика применения указанных критериев заключается в следующем:
1. Определяют (тем
или иным способом) некоторую меру
эффективности
для каждой стратегии
2. Выбирают такую стратегию c*, которая обеспечивает экстремальное значение меры эффективности w*=w(c*).
Критерий Вальда (критерий осторожного наблюдателя). В соответствии с данным критерием выбирается стратегия, максимизирующая полезность в случае, когда среда находится в наихудшем для ЛПР состоянии. Таким образом,
Поскольку
то данный критерий является критерием максимина.
Критерий Лапласа.
В соответствии с данным критерием
выбирается стратегия, максимизирующая
полезность в случае, когда все состояния
среды считаются равновероятными, т.е.
p(θl)=1/L,
Таким образом,
Критерий Гурвица
(обобщенный максимин). В соответствии
с данным критерием выбирается стратегия,
максимизирующая полезность при условии,
что среда может находиться в наилучшем
состоянии с вероятностью α
и в наихудшем состоянии с вероятностью
1-α;
очевидно, что
.
Таким образом,
Критерий Сэвиджа. Чтобы использовать этот критерий, платежную матрицу U необходимо преобразовать в матрицу потерь V. В каждую клетку матрицы потерь записывается разность между максимальным значением полезности при данном состоянии среды и тем значением полезности, которое записано в соответствующей клетке платежной матрицы. Таким образом, элементы vil матрицы потерь определяются из соотношений
В соответствии с критерием Сэвиджа выбирается стратегия, минимизирующая возможные потери при условии, что среда находится в наихудшем для ЛПР состоянии. Таким образом,
Поскольку
то данный критерий является критерием минимакса.
Задачи
2.4. Рассматривается два результата:
Q1 – выпадение 1 при бросании игральной кости,
Q2 – выпадение 2 при бросании игральной кости.
Сформировать четыре составных результата O1÷O4, образующих полную группу несовместных событий, и найти вероятности их получения.
2.5. По объекту противника ведется стрельба. При этом возможны следующие результаты:
1) отсутствие поражения (промах) – ущерб противнику 0 д.е.,
2) незначительное повреждение – ущерб противнику 10 д.е.,
3) значительное повреждение – ущерб противнику 30 д.е.,
4) полное уничтожение – ущерб противнику 60 д.е.
В зависимости от количества израсходованных боеприпасов затраты составляют:
1) малое количество боеприпасов – затраты 10 д.е.,
2) среднее количество боеприпасов – затраты 20 д.е.,
3) большое количество боеприпасов – затраты 40 д.е.
Определить оптимальное количество израсходованных боеприпасов для следующих вероятностей получения результатов: p11=0,3; p12=0,4; p13=0,2; p14=0,1; p21=0,15; p22=0,25; p23=0,35; p24=0,25; p31=0,05; p32=0,1; p33=0,25; p34=0,6.
2.6. Швейная фабрика может изготовить партию пальто. Затраты на изготовление составляют: 20 пальто – 30 д.е., 40 пальто – 58 д.е., 60 пальто – 86 д.е., 80 пальто – 113 д.е.
Доход в зависимости от количества проданных пальто составляет: 20 пальто – 40 д.е., 40 пальто – 80 д.е., 60 пальто – 120 д.е., 80 пальто – 160 д.е.
Определить оптимальное количество изготавливаемых пальто. Найти решение задачи, применив критерии Лапласа, Гурвица (α=0,8).
2.7. Продавец заказывает газеты по цене 0,5 д.е. за газету и продает по цене 1 д.е. Непроданные газеты он возвращает по цене 0,2 д.е. за газету. Продавец знает, что спрос не превышает 50 газет. Определить оптимальное количество заказываемых газет (размер заказа должен быть кратен 10, т.е. продавец может заказать 10, 20, 30, 40 или 50 газет).
Найти решение задачи, применив критерии Вальда, Лапласа, Гурвица (α=0,5) и Сэвиджа.
2.8. Найти решение задачи 2.7 с учетом того, что наблюдение за спросом на газеты в течение 100 дней дало следующие результаты:
Спрос на газеты |
0 |
10 |
20 |
30 |
40 |
50 |
Число дней |
3 |
17 |
37 |
29 |
12 |
2 |