- •Тимакин о.А. Методы оптимальных решений
- •2. Лекция. Экономико – математическое моделирование
- •3.Лекция. Линейное программирование
- •4.Лекция .Транспортная задача
- •5 .Лекция .Целочисленное программирование
- •6. Лекция. Динамическое программирование
- •1 Лекция. Основы теории принятия решений.
- •1.2. Основные понятия системного анализа
- •1.3. Основные понятия исследования операций
- •1.4. Постановка задач для принятия
- •1.5 Методология и методы принятия решений.
- •2.Лекция. Экономико - математическое моделирование
- •2.1 Основные понятия.
- •2. 2 Классификация моделей
- •2. 3 Классификация решаемых экономических задач.
- •3.Лекция . Линейное программирование.
- •3.1 Общая постановка задачи
- •3. 2 Двойственность в задачах линейного программирования
- •3.4 Решение задач линейного программирования
- •3. 5 Симплексный метод решения задач лп
- •4.Лекция. Транспортная задача
- •4. 1 Постановка задачи. Математическая модель
- •4. 2 Алгоритм решения транспортных задач.
- •4.2.1 Метод наименьшего элемента.
- •4. 3 Примеры решения транспортных задач.
- •1.Проверяем задачу на сбалансированность.
- •5.Лекция . Целочисленное программирование.
- •5. 1 Постановка задачи целочисленного программирования.
- •5. 2 Графический метод решения задач целочисленного программирования.
- •3 Пример решения задачи целочисленного программирования.
- •6.1. Постановка задачи.
- •6.2. Принцип оптимальности Беллмана.
- •6.3. Задача распределения средств на 1 год.
- •6.4. Задача распределения средств на два года
- •7.Лекция . Управление производством . Управление запасами.
- •7. 1 Задача о замене оборудования.
- •7. 2 Управление запасами. Складская задача.
- •8.Лекция. Теория игр.
- •8.1 Основные понятия.
- •8.2 Антагонистические игры.
- •8.3 Игры с « природой».
- •2. Критерий Гурвица.
- •3. Критерий Сэвиджа (критерий минимаксного риска).
- •4. Критерий Лапласа. N
- •8.Лекция. Системы массового обслуживания.
- •8.I. Формулировка задачи и характеристики смо
- •8.2 Смо с отказами.
- •8.3 Смо с неограниченным ожиданием
- •8.3.1 Основные понятия
- •8.3.2 Формулы для расчета установившегося режима
- •8.4 Смо с ожиданием и с ограниченной длиной очереди
- •8.4.1 Основные понятия
- •8.4.2Формулы для установившегося режима
- •10.Лекция. Сетевое планирование.
- •10.1 Основные понятия метода сетевого планирования
- •10.2 Расчет сетевых графиков
- •11.Лекция. Нелинейное программирование.
- •11.3. Условный экстремум
- •1 Тема. «линейное программирование».
- •2 Тема. «транспортная задача»
- •3 Тема .«целочисленное программирование»
- •4 Тема. Динамическое программирование.
- •5 Тема . Управление производством . Управление запасами.
- •6 Тема . Теория игр.
- •7 Тема . Системы массового обслуживания
- •8 Тема. Сетевое планирование.
- •10 Тема . Нелинейное програмирование.
8.3 Игры с « природой».
Для того чтобы можно сделать вывод о том какую именно стратегию выбирать игроку, необходимо использовать критерии Вальда, Гурвица, Сэвиджа, Лапласа, Байеса.
1. Критерий Вальда. Рекомендуется применять максиминную стратегию. Она достигается из условия max min αij и совпадает с нижней ценой игры.
i j
Критерий является пессимистическим, считается, что природа будет действовать наихудшим для человека образом, агрессивно, делать все, чтобы помешать нам достигнуть успеха.
Рассмотрим задачу.
Ежедневный спрос на булочки в продовольственном магазине может принимать следующие значения
-
1
2
3
4
5
100
150
200
250
300
Если булочка не продана днем, то она м.б. реализована за 15 центов к концу дня. Свежие булочки продаются по 49 центов за штуку. Затраты магазина на одну булочку 25 центов.
Используя игровой подход, определить, какое число булочек надо заказывать ежедневно.
Составим платежную матрицу. Сначала вычислим прибыль (49-25=24) и убыток (15-25=-10).
|
100 |
150 |
200 |
250 |
300 |
100 |
100*24 |
100*24 |
100*24 |
100*24 |
100*24 |
150 |
100*24-50*10 |
150*24 |
150*24 |
150*24 |
150*24 |
200 |
100*24-100*10 |
150*24-50*10 |
200*24 |
200*24 |
200*24 |
250 |
100*24-150*10 |
150*24-100*10 |
200*24-50*10 |
250*24 |
250*24 |
300 |
100*24-200*10 |
150*24-150*10 |
200*24-100*10 |
250*24-50*10 |
300*24 |
Платежная матрица примет вид
|
100 |
150 |
200 |
250 |
300 |
100 |
2400 |
2400 |
2400 |
2400 |
2400 |
150 |
1900 |
3600 |
3600 |
3600 |
3600 |
200 |
1400 |
3100 |
4800 |
4800 |
4800 |
250 |
900 |
2600 |
4300 |
6000 |
6000 |
300 |
400 |
2100 |
3800 |
5500 |
7200 |
Вычислим критерий Вальда - максиминный. Он отражает принцип гарантированного результата:
Олицетворяет позицию крайнего пессимизма: надо ориентироваться всегда на худшие условия, зная наверняка, что хуже этого не будет. Этот перестраховочный подход для того, кто очень боится проиграть.
Оптимальной считается стратегия, при которой гарантируется выигрыш в любом случае, не меньший, чем нижняя цена игры с природой:
Н = max min αij
i j
Подсчитать min по строкам и выбрать ту стратегию, при которой минимум строки максимален.
-
А1
2400
А2
1900
А3
1400
А4
900
А5
400
Критерий Вальда рекомендует выбирать стратегию А1.
2. Критерий Гурвица (оптимизма - пессимизма). Критерий рекомендует при выборе решения не руководствоваться ни крайним пессимизмом (всегда рассчитывай на худшее), ни крайним легкомысленным оптимизмом (авось кривая выведет). Критерий рекомендует стратегию, определяемую по формуле
H = Max {γmin aij + (1- γ)max aij}
ijj
где γ - степень оптимизма - изменяется в диапазоне [0, 1].
Критерий придерживается некоторой промежуточной позиции, учитывающей возможность как наихудшего, так и наилучшего поведения природы. При γ = 1 критерий превращается в критерий Вальда, при γ = 0 - в критерий максимума. На γ оказывает влияние степень ответственности лица, принимающего решение по выбору стратегии. Чем хуже последствия ошибочных решений, больше желания застраховаться, тем γ ближе к единице.
Рассмотрим платежную матрицу.
Параметр Гурвица возьмем равным 0,6.
|
min |
max |
γmin aij + (1- γ)max aij |
А1 |
2400 |
2400 |
2400*0.6+0.4*2400=2400 |
А2 |
1900 |
3600 |
1900*0.6+3600*0.4=2580 |
А3 |
1400 |
4800 |
1400*0.6+4800*0.4=2760 |
А4 |
900 |
6000 |
900*0.6+6000*0.4=2940 |
А5 |
400 |
7200 |
400*0.6+7200*0.4=3120 |
Критерий Гурвица рекомендует стратегию А5.
3. Критерий Сэвиджа. Суть критерия состоит в выборе такой стратегии, чтобы не допустить чрезмерно высоких потерь, к которым она может привести. Находится матрица рисков, элементы которой показывают, какой убыток понесет человек (фирма), если для каждого состояния природы он не выберет наилучшей стратегии.
Элементы матрицы рисков находится по формуле (rij):
rij = max aij - aij
где max aij - максимальный элемент в столбце исходной матрицы.
Оптимальная стратегия находится из выражения
H = Min {max(max aij - aij)}
Составим матрицу риска, (max aij - aij).
Выберем максимальный элемент в столбце и вычитаем из него остальные элементы столбца, получим max(max aij - aij).
|
100 |
150 |
200 |
250 |
300 |
Мax |
А1 |
0 |
1200 |
2400 |
3600 |
4800 |
4800 |
А2 |
500 |
0 |
1200 |
2400 |
3600 |
3600 |
А3 |
1000 |
500 |
0 |
1200 |
2400 |
2400 |
А4 |
1500 |
1000 |
500 |
0 |
1200 |
1500 |
А5 |
2000 |
1500 |
1000 |
500 |
0 |
2000 |
Из максимальных значений последнего столбца выбираем минимальную величину, получим Min {max(max aij - aij)}.
Критерий Сэвиджа рекомендует стратегию А4.
4. Критерий Лапласа. Этот критерий основывается на принципе недостаточного обоснования. Поскольку вероятности состояния не известны, необходимая информация для вывода, что эти вероятности различны, отсутствует. Поэтому можно предположить, что они равны. Выбор стратегии осуществляется по формуле
H = Max {1/n·∑ aij}
где 1/n вероятность реализации одного из состояний р = 1/n.
-
А1
(2400+2400+2400+2400+2400)/5=2400
А2
(1900+3600+3600+3600+3600)/5=3260
А3
(1400+3100+4800+4800+4800)/5=3780
А4
(900+2600+4300+6000+6000)/5=3960
А5
(400+2100+3800+5500+7200)/5=3800
Критерий Лапласа рекомендует нам стратегию А4.
Таким образом, рассмотрев одну платежную матрицу, мы получили, что критерии Лапласа и Сэвиджа рекомендует стратегию А4. То есть необходимый заказ булочек составит 250 единиц ежедневно.
5. Критерий Байеса. Принятие решения в условиях риска.
Если в рассмотренных выше критериях, необходимая информация о вероятностях какого-либо состояния отсутствовала, то критерий Байеса действует в условиях не полной информации, т.е. в условиях риска (имеется информация о вероятностях применения стратегий второй стороной). Эти вероятности называются априорными вероятностями.
Выбор стратегии осуществляется по формуле
H = Max {∑pi aij}
Ежедневный спрос на булочки в продовольственном магазине задается следующим распределением вероятностей
-
1
2
3
4
5
100
150
200
250
300
0,2
0,25
0,3
0,15
0,1
Поставив значение aij и pi в формулу, получим:
-
А1
2400*0,2+2400*0,25+2400*0,3+2400*0,15+2400*0,1=2400
А2
1900*0,2+3600*0,25+3600*0,3+3600*0,15+3600*0,1=3260
А3
1400*0,2+3100*0,25+4800*0,3+4800*0,15+4800*0,1=3695
А4
900*0,2+2600*0,25+4300*0,3+6000*0,15+6000*0,1=3620
А5
400*0,2+2100*0,25+3800*0,3+5500*0,15+7200*0,1=3290
Критерий Байеса рекомендует стратегию А3
В условиях полной неопределенности теория не дает однозначных принципов выбора того или иного критерия.
Оптимальные стратегии, выбранные по различным критериям, различны.
Таким образом, окончательный вывод зависит от предпочтений человека, который принимает решение.
ПРИМЕР №1
Найти оптимальные стратегии 1-го игрока, исходя из различных критериев, в игре с полной неопределенностью относительно второго игрока, заданной платежной матрицей:
а11 а12 а13 а14 5 10 18 25
а21 а22 а23 а24 8 7 8 23
А = а31 а32 а33 а34 ; А = 21 18 12 21
а41 а42 а43 а44 20 22 19 15
Решение.
1. Максиминный критерий Вальда. max min аij
i j
Вычислим минимальные значения по строкам min аij, а далее из них выберем максимальное.
5 10 18 25 5
А = 8 7 8 23 7
21 18 12 21 12
20 22 19 15 15
Таким образом, получаем Н = max min аij = 15 при применении стратегии А4. i j
Ответ: оптимальной стратегией 1-го игрока А является
стратегия А4.