- •Теория принятия решений
- •Оглавление
- •Ключевые слова
- •Основные понятия
- •Часть 1. Принятие решения в условиях определенности Метод анализа иерархий
- •1.1 Постановка задачи
- •1.2 Описание алгоритма решения задачи
- •1.3 Пример решения задачи
- •Часть 2. Принятие решения в условиях неопределенности.
- •2.1 Постановка задачи
- •2.2 Описание алгоритма решения задачи
- •2.3 Пример решения задачи
- •Часть 3. Принятие решения в условиях риска
- •3.1 Постановка задачи
- •3.2 Описание алгоритма решения задачи
- •3.3 Пример решения задачи
- •Часть 4. Марковская задача принятия решений
- •4.1 Постановка задачи
- •4.2 Описание алгоритма решения задачи
- •Модель динамического программирования с конечным числом этапов
- •Модель динамического программирования с бесконечным числом этапов
- •Метод полного перебора
- •Метод итерации по стратегиям без дисконтирования
- •4.3 Пример решения задачи для конечного числа этапов
- •4.4 Пример решения задачи с бесконечным числом этапов методом полного перебора
- •4.5 Пример решения задачи с бесконечным числом этапов методом итерации по стратегиям без дисконтирования
- •Заключение
- •Литература
4.5 Пример решения задачи с бесконечным числом этапов методом итерации по стратегиям без дисконтирования
Решим задачу, описанную в предыдущем примере методом итерации по стратегиям без дисконтирования.
Решение задачи можно начать с произвольной стратегии. Пусть в качестве начальной рассматривается стратегия, исключающая применение каких-либо мер по стимулированию спроса. Имеем соответствующие матрицы.
P1 = |
|
1 |
2 |
3 |
|
R1 = |
|
1 |
2 |
3 |
1 |
0,3 |
0,3 |
0,4 |
|
1 |
100 |
90 |
70 | ||
2 |
0,1 |
0,7 |
0,2 |
|
2 |
110 |
95 |
65 | ||
3 |
0,05 |
0,2 |
0,75 |
|
3 |
100 |
85 |
60 |
Уравнения шага оценивания параметров принимают вид
Полагая f(3) = 0, получаем решение этих уравнений
E = 78,547, f(1) = 30,676, f(2) = 50,068, f(3) = 0.
Перейдем к шагу улучшения стратегии. Результаты вычислений приведены в таблице.
|
Оптимальное решение | ||||
i |
k = 1 |
k = 2 |
k = 3 |
f(i) | |
1 |
85 + 0,3·30,676 + 0,3·50,068 + 0,4·0= 109,223 |
138,304 |
153,244 |
153,244 |
3 |
2 |
90,5 + 0,1·30,676 + 0,7·50,068 + 0,2·0= 128,615 |
117,108 |
111,027 |
128,615 |
1 |
3 |
67 + 0,05·30,676 + 0,2·50,068 + 0,75·0= 78,547 |
75,014 |
93,614 |
93,614 |
3 |
Новая стратегия предусматривает организацию бесплатной доставки, если объем продаж на уровне 1 или 3. Новой стратегии соответствуют матрицы
P14 = |
|
1 |
2 |
3 |
|
R14 = |
|
1 |
2 |
3 |
1 |
0,3 |
0,6 |
0,1 |
|
1 |
130 |
110 |
90 | ||
2 |
0,1 |
0,7 |
0,2 |
|
2 |
110 |
95 |
65 | ||
3 |
0 |
0,2 |
0,8 |
|
3 |
125 |
98 |
80 |
Эти матрицы определяют следующие уравнения:
Полагая f(3) = 0, получаем решение этих уравнений
E = 88,677, f(1) = 57,935, f(2) = 25,387, f(3) = 0.
Результаты вычислений на шаге улучшения стратегии приведены в следующей таблице.
|
Оптимальное решение | ||||
i |
k = 1 |
k = 2 |
k = 3 |
f(i) | |
1 |
109,997 |
136,868 |
146,613 |
146,613 |
3 |
2 |
114,064 |
105,026 |
101,155 |
114,064 |
1 |
3 |
74,974 |
70,077 |
88,677 |
88,677 |
3 |
Новая стратегия идентична предыдущей, поэтому последняя стратегия оптимальна и итеративный процесс заканчивается. Естественно, что этот результат совпадает с результатом, полученным методом полного перебора. Однако, следует отметить, что метод итерации по стратегиям достаточно быстро сходится к оптимальному решению, что является его характерной особенностью.
Заключение
В настоящем методическом указании рассмотрены три алгоритма принятия решения: в условиях определенности, в условиях риска и в условиях неопределенности.
В первой части указания изложена методика принятия решения в условиях определенности с использованием понятий парного сравнения, согласованности суждений и комбинированного весового коэффициента. Обоснованным считается то решение, в котором суждения не противоречат друг другу и комбинированный весовой коэффициент имеет максимальное значение.
Во второй части указания изложен подход для формирования принятия решения в условиях неопределенности. Под неопределенностью подразумевается отсутствие конкретных значений параметров системы и их вероятности появления. Вместе с тем при этом известны интервалы изменения этих параметров. Критерий принятия решения выбирается в зависимости от предполагаемого сценария развития системы: оптимистический ,пессимистический или промежуточный между ними, а так же от того определяются максимальные доходы или минимальные расходы.
В третьей части указания изложен подход для формирования принятия решения в условиях
риска с использованием вероятностных характеристик параметров анализируемой системы. При
чем для улучшения качества прогноза используются апостериорные вероятности полученные на
основе дополнительного анализа системы.
В четвертой части указания изложена методика принятия решения когда известен вероятностный механизм перехода текущего состояния системы в будущий, который представляется в виде марковской цепи. Последняя представляет собой конечное или бесконечное чередование матриц переходных вероятностей и матриц доходов. В постановке задачи использовались понятия состояние системы, временные этапы, альтернативы принятия решения, функция состояния. Поэтому для поиска решения использовался метод динамического программирования.