Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лабораторные работы_ТПР.doc
Скачиваний:
41
Добавлен:
02.03.2016
Размер:
1.49 Mб
Скачать

4.5 Пример решения задачи с бесконечным числом этапов методом итерации по стратегиям без дисконтирования

Решим задачу, описанную в предыдущем примере методом итерации по стратегиям без дисконтирования.

Решение задачи можно начать с произвольной стратегии. Пусть в качестве начальной рассматривается стратегия, исключающая применение каких-либо мер по стимулированию спроса. Имеем соответствующие матрицы.

P1 =

 

1

2

3

R1 =

 

1

2

3

1

0,3

0,3

0,4

1

100

90

70

2

0,1

0,7

0,2

2

110

95

65

3

0,05

0,2

0,75

3

100

85

60

Уравнения шага оценивания параметров принимают вид

Полагая f(3) = 0, получаем решение этих уравнений

E = 78,547, f(1) = 30,676, f(2) = 50,068, f(3) = 0.

Перейдем к шагу улучшения стратегии. Результаты вычислений приведены в таблице.

Оптимальное решение

i

k = 1

k = 2

k = 3

f(i)

1

85 + 0,3·30,676 + 0,3·50,068 + 0,4·0= 109,223

138,304

153,244

153,244

3

2

90,5 + 0,1·30,676 + 0,7·50,068 + 0,2·0= 128,615

117,108

111,027

128,615

1

3

67 + 0,05·30,676 + 0,2·50,068 + 0,75·0= 78,547

75,014

93,614

93,614

3

Новая стратегия предусматривает организацию бесплатной доставки, если объем продаж на уровне 1 или 3. Новой стратегии соответствуют матрицы

P14 =

 

1

2

3

R14 =

 

1

2

3

1

0,3

0,6

0,1

1

130

110

90

2

0,1

0,7

0,2

2

110

95

65

3

0

0,2

0,8

3

125

98

80

Эти матрицы определяют следующие уравнения:

Полагая f(3) = 0, получаем решение этих уравнений

E = 88,677, f(1) = 57,935, f(2) = 25,387, f(3) = 0.

Результаты вычислений на шаге улучшения стратегии приведены в следующей таблице.

Оптимальное решение

i

k = 1

k = 2

k = 3

f(i)

1

109,997

136,868

146,613

146,613

3

2

114,064

105,026

101,155

114,064

1

3

74,974

70,077

88,677

88,677

3

Новая стратегия идентична предыдущей, поэтому последняя стратегия оптимальна и итеративный процесс заканчивается. Естественно, что этот результат совпадает с результатом, полученным методом полного перебора. Однако, следует отметить, что метод итерации по стратегиям достаточно быстро сходится к оптимальному решению, что является его характерной особенностью.

Заключение

В настоящем методическом указании рассмотрены три алгоритма принятия решения: в условиях определенности, в условиях риска и в условиях неопределенности.

В первой части указания изложена методика принятия решения в условиях определенности с использованием понятий парного сравнения, согласованности суждений и комбинированного весового коэффициента. Обоснованным считается то решение, в котором суждения не противоречат друг другу и комбинированный весовой коэффициент имеет максимальное значение.

Во второй части указания изложен подход для формирования принятия решения в условиях неопределенности. Под неопределенностью подразумевается отсутствие конкретных значений параметров системы и их вероятности появления. Вместе с тем при этом известны интервалы изменения этих параметров. Критерий принятия решения выбирается в зависимости от предполагаемого сценария развития системы: оптимистический ,пессимистический или промежуточный между ними, а так же от того определяются максимальные доходы или минимальные расходы.

В третьей части указания изложен подход для формирования принятия решения в условиях

риска с использованием вероятностных характеристик параметров анализируемой системы. При

чем для улучшения качества прогноза используются апостериорные вероятности полученные на

основе дополнительного анализа системы.

В четвертой части указания изложена методика принятия решения когда известен вероятностный механизм перехода текущего состояния системы в будущий, который представляется в виде марковской цепи. Последняя представляет собой конечное или бесконечное чередование матриц переходных вероятностей и матриц доходов. В постановке задачи использовались понятия состояние системы, временные этапы, альтернативы принятия решения, функция состояния. Поэтому для поиска решения использовался метод динамического программирования.