
- •Методические указания
- •И задания по дисциплинам
- •Системный анализ и исследование операций
- •Теория принятия решений
- •Краткие методические указания по самостоятельному изучению курса
- •Задания на контрольные работы и указания к их выполнению
- •Контрольная работа №1
- •Варианты заданий
- •Контрольная работа №2
- •Краткая теория и пояснения к решению
- •Метод потенциалов.
- •Дополнительный материал к решению корневой задачи
- •Вопросы к экзамену по са и ио
- •Указания к дисциплине «Теория принятия решений»
- •Литература к реферату по тпр
- •Примерные темы рефератов
Задания на контрольные работы и указания к их выполнению
В соответствии с учебным планом по дисциплине СА и ИО выполняются 2 контрольные работы. Варианты работ выдает преподаватель на установочной сессии.
Общие правила оформления работы:
работа включает титульный лист с номером контрольной, задания с указанием варианта, собственно содержание согласно заданиям, список использованной литературы:
допускается предъявлять рукописный текст при условии разборчивости почерка;
изложение должно быть грамотным, а графическая часть четкой и аккуратной;
все страницы нумеруются и скрепляются.
Рекомендуется одну сторону листов оставлять чистой для внесения исправлений и дополнений, которые могут потребоваться после проверки работы преподавателем.
Для успешной защиты завершенной работы необходимо уметь объяснить ход решения, правильно интерпретировать результаты и ответить на 2-3 вопроса по теме работы.
Контрольная работа №1
Она состоит из трех заданий по темам: методы классического анализа, игровые задачи, методы динамического программирования..
Первое задание заключается в решении детерминированной задачи управления запасами. Формулировка задания и варианты приведены в [2, стр.50-52] или [3, стр.54-55]. В разд. 3.1 этих пособий разбирается ход решения подобных задач. Для решения задачи применяется метод классического анализа, который заключается в аналитическом нахождении и исследовании критических точек (см. гл.3 в [2] или [3]) .
При защите обращается внимание на знание и понимание необходимых и достаточных условий экстремума, критических точек и анализ результатов решения.
ЗАДАНИЕ ВТОРОЕ
Найти решение игры двух лиц с нулевой суммой графическим методом. Для сокращения числа стратегий использовать отношение доминирования. В приведенных ниже вариантах платежных матриц строки соответствуют стратегиям 1-го игрока, а столбцы – стратегиям 2-го. Платежи имеют смысл выигрыша или проигрыша для 1-го игрока (обозначено буквами В и П соответственно после номера варианта).
Указания. Для выполнения этого задания проработайте материал, изложенный в [1, стр.547-558] или [3, стр.27-31]. Сначала найдите верхнюю и нижнюю цену игры. Затем, используя отношение доминирования, сократите платежную матрицу. Отношение доминирования – это бинарное отношение, т.е. для установления его наличия или отсутствия надо сравнивать пары стратегий (сначала А, затем В или наоборот, или можно чередовать). Данное отношение имеет место при сравнимости стратегий и отсутствует, если они не сравнимы (в одной позиции одна лучше, в другой – другая). Доминируемая, то есть. худшая с позиций данного игрока стратегия отбрасывается. Сначала решение ищется для игрока, у которого осталось 2 стратегии, затем для другого игрока.
При защите основное внимание уделяется пониманию смысла найденных величин и реализации оптимальных поведений игроков.
Варианты заданий
1 (П) 2 (В) 3 (П) 4 (В)
–2 |
4 |
0 |
5 |
|
7 |
4 |
2 |
–2 |
0 |
|
5 |
3 |
–1 |
0 |
|
1 |
3 |
0 |
4 |
3 |
–2 |
1 |
4 |
|
5 |
2 |
–1 |
4 |
7 |
|
–2 |
1 |
2 |
2 |
|
–5 |
1 |
–6 |
2 |
1 |
–3 |
–2 |
–1 |
|
7 |
1 |
0 |
–2 |
–1 |
|
5 |
6 |
7 |
7 |
|
3 |
–2 |
3 |
–1 |
0 |
4 |
1 |
6 |
|
|
|
|
|
|
|
8 |
3 |
–4 |
4 |
|
5 |
3 |
4 |
3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
5 |
2 |
6 |
5 (В) 6 (П) 7 (П) 8 (В)
4 |
0 |
2 |
1 |
|
4 |
–2 |
6 |
3 |
4 |
|
5 |
–2 |
1 |
2 |
|
6 |
2 |
5 |
–1 |
6 |
7 |
1 |
7 |
|
2 |
5 |
2 |
6 |
1 |
|
0 |
–8 |
8 |
0 |
|
4 |
–4 |
2 |
5 |
5 |
1 |
2 |
1 |
|
–1 |
4 |
0 |
4 |
–1 |
|
3 |
0 |
6 |
3 |
|
5 |
2 |
3 |
–1 |
9 (П) 10 (В) 11 (П) 12 (В)
1,5 |
3 |
–5 |
0 |
|
8 |
3 |
2 |
–2 |
0 |
|
7 |
2 |
–1 |
4 |
|
4 |
–1 |
7 |
4 |
7 |
1 |
4 |
2 |
|
5 |
2 |
–1 |
4 |
7 |
|
3 |
0 |
2 |
5 |
|
–2 |
0 |
1 |
–1 |
1 |
2 |
–5 |
0 |
|
7 |
1 |
0 |
–2 |
–1 |
|
8 |
2 |
6 |
4 |
|
5 |
3 |
2 |
5 |
7,5 |
2 |
6 |
3 |
|
4 |
2 |
–2 |
3 |
6 |
|
3 |
–2 |
1 |
5 |
|
0 |
–2 |
–5 |
1 |
13 (П) 14 (В) 15 (П) 16 (В)
30 |
10 |
40 |
28 |
|
1,5 |
0,51 |
0,44 |
0,6 |
|
3 |
–1 |
4 |
|
10 |
6 |
9 |
–2 |
90 |
50 |
90 |
85 |
|
0,4 |
1,5 |
1,5 |
1,6 |
|
–5 |
2 |
–3 |
|
4 |
–1 |
7 |
11 |
40 |
80 |
50 |
30 |
|
1,08 |
1,1 |
1,0 |
1,1 |
|
2 |
7 |
2 |
|
12 |
6 |
10 |
–1 |
20 |
30 |
20 |
20 |
|
0,9 |
1,25 |
1,22 |
1,3 |
|
4 |
3 |
6 |
|
4 |
5 |
7 |
13 |
17 (П) 18(В) 19(П) 20 (В)
–5 |
0 |
–2 |
1 |
|
3 |
–1 |
5 |
|
0 |
5 |
–1 |
4 |
|
5 |
2 |
–1 |
4 |
7 |
4 |
3 |
–1 |
7 |
|
–2 |
6 |
0 |
|
2 |
4 |
3 |
–2 |
|
7 |
1 |
0 |
–2 |
–1 |
8 |
–3 |
4 |
–2 |
|
7 |
–3 |
7 |
|
–2 |
–1 |
1 |
–3 |
|
8 |
4 |
2 |
–2 |
0 |
|
|
|
|
|
–4 |
2 |
–3 |
|
1 |
6 |
0 |
4 |
|
|
|
|
|
|
21(П) 22(В) 23(П) 24(В)
–5 |
0 |
–2 |
1 |
|
3 |
–1 |
5 |
|
0 |
5 |
–1 |
4 |
|
5 |
2 |
–1 |
4 |
7 |
4 |
3 |
–1 |
7 |
|
–2 |
6 |
0 |
|
2 |
4 |
3 |
–2 |
|
7 |
1 |
0 |
–2 |
–1 |
8 |
3 |
4 |
–2 |
|
7 |
–3 |
7 |
|
–2 |
–1 |
1 |
–3 |
|
8 |
4 |
2 |
–2 |
0 |
|
|
|
|
|
–4 |
2 |
–3 |
|
1 |
6 |
0 |
4 |
|
|
|
|
|
|
25(П) 26(В) 27(П) 28(В)
–2 |
1 |
2 |
2 |
|
3 |
0 |
4 |
|
9 |
–2 |
5 |
1 |
|
0 |
3 |
–1 |
5 |
||
8 |
3 |
–4 |
4 |
|
1 |
–6 |
2 |
|
–5 |
0 |
–2 |
1 |
|
7 |
–2 |
6 |
0 |
||
3 |
0 |
–1 |
0 |
|
–2 |
3 |
–1 |
|
4 |
3 |
–1 |
7 |
|
–2 |
7 |
–3 |
7 |
||
5 |
6 |
7 |
7 |
|
3 |
4 |
7 |
|
8 |
–3 |
4 |
–2 |
|
3 |
–4 |
2 |
–3 |
||
|
|
|
|
|
5 |
2 |
6 |
|
|
|
|
|
|
|
|
|
|
29(П) 30(В) 31(П) 32(В)
–1 |
4 |
0 |
5 |
|
8 |
4 |
2 |
–2 |
0 |
|
3 |
0 |
–1 |
0 |
|
2 |
3 |
0 |
4 |
3 |
–2 |
2 |
4 |
|
5 |
2 |
–1 |
4 |
7 |
|
–2 |
1 |
2 |
2 |
|
–5 |
1 |
–6 |
2 |
1 |
–3 |
–2 |
–1 |
|
7 |
1 |
0 |
–2 |
–1 |
|
5 |
6 |
7 |
7 |
|
3 |
–2 |
3 |
–1 |
0 |
4 |
1 |
6 |
|
|
|
|
|
|
|
8 |
3 |
–4 |
4 |
|
5 |
3 |
4 |
7 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
5 |
2 |
6 |
33(П) 34(В) 35(П) 36(В)
1 |
2 |
3 |
|
5 |
4 |
3 |
6 |
0 |
|
5 |
8 |
7 |
|
–1 |
3 |
1 |
0 |
3 |
–2 |
0 |
–1 |
|
4 |
–2 |
0 |
7 |
1 |
|
2 |
4 |
1 |
|
0 |
2 |
–2 |
1 |
1 |
3 |
–1 |
4 |
|
3 |
1 |
2 |
6 |
0 |
|
–1 |
2 |
0 |
|
4 |
–2 |
–3 |
4 |
5 |
2 |
6 |
2 |
|
|
|
|
|
|
|
4 |
–2 |
–2 |
|
5 |
4 |
–1 |
6 |
6 |
0 |
4 |
5 |
|
|
|
|
|
|
|
7 |
0 |
–1 |
|
|
|
|
|
|
37(П) 38(В) 39(П) 40(В)
–2 |
1 |
2 |
2 |
|
3 |
0 |
4 |
|
9 |
–2 |
5 |
1 |
|
0 |
3 |
–1 |
5 |
8 |
3 |
–4 |
4 |
|
1 |
–6 |
2 |
|
–5 |
0 |
–2 |
1 |
|
7 |
–2 |
6 |
0 |
3 |
0 |
–1 |
0 |
|
–2 |
3 |
–1 |
|
4 |
3 |
–1 |
7 |
|
–2 |
7 |
–3 |
7 |
5 |
6 |
7 |
7 |
|
3 |
4 |
7 |
|
8 |
–3 |
4 |
–2 |
|
3 |
–4 |
2 |
–3 |
|
|
|
|
|
5 |
2 |
1 |
|
|
|
|
|
|
|
|
|
|
41 (П) 42 (В) 43 (П) 44 (В)
–1 |
4 |
0 |
5 |
|
8 |
4 |
2 |
–2 |
0 |
|
3 |
0 |
–1 |
0 |
|
2 |
3 |
0 |
4 |
3 |
–2 |
2 |
4 |
|
5 |
2 |
–1 |
4 |
7 |
|
–2 |
1 |
2 |
2 |
|
–5 |
1 |
–6 |
2 |
1 |
–3 |
–2 |
–1 |
|
7 |
1 |
0 |
–2 |
–1 |
|
5 |
6 |
7 |
7 |
|
3 |
–2 |
3 |
–1 |
0 |
4 |
1 |
6 |
|
|
|
|
|
|
|
8 |
3 |
–4 |
4 |
|
5 |
3 |
4 |
7 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
5 |
2 |
6 |
45 (П) 46 (В) 47 (П) 48(В)
1 |
2 |
3 |
|
5 |
4 |
3 |
6 |
0 |
|
5 |
8 |
7 |
|
–1 |
3 |
2 |
0 |
3 |
–2 |
0 |
–1 |
|
4 |
–2 |
0 |
7 |
1 |
|
2 |
4 |
1 |
|
0 |
2 |
–2 |
1 |
1 |
3 |
–1 |
4 |
|
3 |
4 |
2 |
6 |
0 |
|
–1 |
2 |
0 |
|
4 |
–2 |
–3 |
4 |
5 |
2 |
6 |
2 |
|
|
|
|
|
|
|
4 |
–2 |
–2 |
|
5 |
4 |
–1 |
6 |
6 |
0 |
4 |
5 |
|
|
|
|
|
|
|
7 |
0 |
–1 |
|
|
|
|
|
|
Пример решения игровой задачи
Найти графическое решение (используя свойство доминирования) игры двух лиц с нулевой суммой. Строки - стратегии игрока А; столбцы – стратегии игрока В. В приведенной ниже матрице платежи - выигрыши для игрока А.
|
B1 |
B2 |
B3 |
A1 |
5 |
-2 |
6 |
A2 |
-3 |
0 |
-1 |
A3 |
4 |
3 |
1 |
A4 |
0 |
-3 |
-4 |
Решение:
Принцип гарантированного результата будут применять оба игрока: каждый оценивает свои стратегии по наихудшему результату, показанному в добавленных строке и столбце.
|
B1 |
B2 |
B3 |
min |
A1 |
5 |
-2 |
6 |
-2 |
A2 |
-3 |
0 |
-1 |
-3 |
A3 |
4 |
3 |
1 |
1 |
A4 |
0 |
-3 |
-4 |
-4 |
max |
5 |
3 |
6 |
3 / 1 |
Из этих оценок определяем:
max i min j(платежей) =н=1 - нижняя цена игры, min j max i(платежей) =в =3- верхняя цена игры.
Решение находится в области смешанных стратегий, так как верхняя и нижняя граница не равны. Соответственно игроки будут применять более одной стратегии, то есть оптимальное поведение состоит в смешении нескольких стратегий в сочетании, определяемом вероятностями активных стратегий. В результате решения игры должны быть найдены распределения вероятностей на стратегиях каждого из игроков и цена игры. В нашей задаче платежная матрица не имеет седловой точки.
Решение такой задачи можно найти графически только в том случае, если у одного из игроков 2 стратегии. Применим свойство доминирования для уменьшения числа стратегий.
Из матрицы уберем те стратегии, которые ведут к худшему результату: для игрока А (меньшим выигрышам). В результате сравнения А1 и А4 видим, что стратегия А4 менее эффективна, чем А1 при любых стратегиях игрока В, а А2 менее эффективна, чем А3. В новой матрице оставим только доминирующие стратегии А1 и А3.
В результате получим следующую матрицу:
|
B1 |
B2 |
B3 |
A1 |
5 |
-2 |
6 |
A3 |
4 |
3 |
1 |
Для графического решения проводятся две оси ординат на расстоянии, которое принимается за единицу вероятности. На этих осях откладываются платежи игрока, имеющего две стратегии. В нашем примере мы рассмотрим графические решения для обоих игроков.
Д
ля
игрока А:
Оси ординат соответствуют стратегиям А1 и А3 и на них откладываются выигрыши игрока А. При фиксированной стратегии игрока В. выигрыш игрока А зависит от вероятности применения его стратегий линейно.
Графические построения показаны на рис.1. По оси абсцисс отложены вероятности применения стратегий. Обратите внимание, вероятность стратегии PA3 растёт от левого края, а PA1 от правого. Гарантированные выигрыши игрока А лежат на нижней грани, выделенной жирной линией. Очевидно, что игрок стремится к максимальному гарантированному выигрышу, который достигается в точке М. Найдем координаты точки М:
1
)
уравнение прямой, характеризующей
выигрыши игрока А при фиксированной
стратегии В2:
y=5x – 2;
2) уравнение прямой, соответствующей В3: y= –5x + 6;
3) находим пересечение этих прямых:
5x – 2= –5x + 6;
отсюда получаем: x=0.8 – это вероятность применения стратегии А3, (1 - x)=0,2 – вероятность применения стратегии А1; y=5*0.8-2=2 – это цена игры - .
Следовательно, оптимальное решение игрока А, состоит в применении стратегии А1 с вероятностью PA1=0.2 и стратегии А3 с вероятностью PA3=0.8. Такое поведение гарантирует ему средний выигрыш =2 .
А теперь можно найти решение для игрока В:
Его активные стратегии (вероятности которых больше нуля) определяются точкой М на рис.1, это В2 и В3. Вероятности применения этих стратегий находятся построением графика, аналогичного вышеприведенному для игрока А, но оси ординат соответствуют активным стратегиям игрока В (рис.2).
Найдем координаты точки М:
1) уравнение прямой, характеризующей проигрыши игрока В при фиксированной стратегии А1: y=8x –2;
2) уравнение прямой при фиксированной А3: y= –2x +3;
3) находим пересечение прямых:
8x–2= –2x+3,
следовательно, x=0.5 – это вероятность применения стратегии В3, (1 - x)=0,5 - вероятность применения стратегии В2;
y=8*0.5–2=2 – это цена игры .
Гарантированные проигрыши игрока В лежат на верхней грани. Очевидно, что игрок стремится к минимальному гарантированному проигрышу, который достигается в точке М. Следовательно, оптимальное решение игрока В состоит в применении стратегии В2 с вероятностью PВ2=0.5 и стратегии В3 с вероятностью PВ3=0.5. При этом его проигрыш в среднем составит =2.
ЗАДАНИЕ ТРЕТЬЕ
Необходимо решить задачу исследования операций методом динамического программирования. Подробные методические указания по решению и оформлению задачи и варианты заданий приведены в [2, стр.93-112] или [3, стр.291-309 ]. До решения задачи изучите метод в [1, стр.412-438] и [2, гл.4] или [2, гл.9]. Разберите детально пример решения подобных задач (стр.72-79 в [2] или стр.270-276 в [3]). При решении следуйте шагам процедуры динамического программирования. Перед численными вычислениями (программированием) покажите рекуррентное соотношение преподавателю.
Контрольные вопросы к работе №1
В каких точках следует искать минимум затрат на управление запасами?
В чем состоят необходимые условия экстремума?
В чем состоят достаточные условия минимума и максимума?
Какой вариант управления запасами выгоднее и почему?
Что значит “решить игру”?
При каких условиях можно ожидать тот результат игры, который дает теория?
Каков смысл нижней цены игры для каждого из игроков?
Что показывает верхняя цена игры?
Каков смысл цены игры?
Для каких задач применим метод динамического программирования?
Смысл состояния в вашей задаче?
Что представляет собой каждая функция последовательности в динамическом программировании?
Чем отличается условная оптимизация от безусловной?
Зависит ли результат от порядка закрепления объектов за шагами оптимизации?
Как найти решение при изменении ресурса?
Как по значениям последовательности функций определить оптимальное значение критерия нескольких последовательных шагов (например, 2 и 3 шагов)?