ТПР_ЛР1_Ибрагимова_МО417
.docxУФИМСКИЙ ГОСУДАРСТВЕННЫЙ АВИАЦИОННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
ФАКУЛЬТЕТ ИНФОРМАТИКИ И РОБОТОТЕХНИКИ
КАФЕДРА ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ И КИБЕРНЕТИКИ
Отчёт по лабораторной работе №1
«Дискретные марковские процессы»
по предмету: “Теория принятия решений”
Выполнил:
студент группы МО-417
Ибрагимова К.Б.
Проверил:
доцент каф. ВМиК
Николаева М. А.
Уфа 2021
Цель работы: освоение способов принятия решений в условиях риска.
Цель работы
Целью работы является освоение способов принятия решений в условиях риска.
Задачи:
1. Изучение рекуррентного метода дискретных марковских процессов (ДМП).
2. Реализация алгоритма для решения конкретной задачи.
Постановка задачи
Дано:
N – число состояний системы (оно неизменно на каждом этапе);
k – номер стратегии;
n – количество этапов моделирования;
– вероятность перехода от одного состояния (i) к другому (j);
– доходность.
Обозначим: – ожидаемая доходность; – полная ожидаемая доходность на n-ом этапе моделирования.
Требуется найти: – номера оптимальных стратегий на каждом этапе процесса (n=1, 2, 3…) для каждого i-того состояния системы.
Пример
В качестве примера возьмем три состояния качества растения в оранжерее для продажи: неудовлетворительное (3), удовлетворительное (2), отличное (1).
В качестве стратегий возьмем:
Профессиональный уход c современными технологиями подачи воды – в уходе за растением соблюдаются все требования и рекомендации в соответствии с его видом, а для полива растения используются новые технологии.
Профессиональный уход c современными технологиями регулировки освещения – в уходе за растением соблюдаются все требования и рекомендации в соответствии с его видом, а в установлении длительности и яркости режимов освещения используются новые технологии.
Профессиональный уход с современными технологиями регулировки температуры – в уходе за растением соблюдаются все требования и рекомендации в соответствии с его видом, а температурный режим помещения для растения регулируется новыми технологиями.
Для каждой стратегии заполним матрицы вероятностей и доходности.
Таблица 1.1
Матрицы переходных вероятностей
М(1) |
1 |
2 |
3 |
А(2) |
1 |
2 |
3 |
Ф(3) |
1 |
2 |
3 |
1 |
0,6 |
0,4 |
0 |
1 |
0,7 |
0,3 |
0 |
1 |
0,8 |
0,2 |
0 |
2 |
0,2 |
0,7 |
0,1 |
2 |
0,3 |
0,6 |
0,1 |
2 |
0,4 |
0,5 |
0,1 |
3 |
0 |
0,3 |
0,7 |
3 |
0 |
0,2 |
0,8 |
3 |
0 |
0,1 |
0,9 |
Таблица 1.2
Матрицы доходностей
М(1) |
1 |
2 |
3 |
А(2) |
1 |
2 |
3 |
Ф(3) |
1 |
2 |
3 |
1 |
9,1 |
11,21 |
0 |
1 |
8,7 |
12,65 |
0 |
1 |
11 |
10,9 |
0 |
2 |
5,5 |
6,8 |
3,4 |
2 |
4,9 |
8,27 |
3,1 |
2 |
5,3 |
6,63 |
3,5 |
3 |
0 |
5,42 |
1,8 |
3 |
0 |
7,6 |
1,6 |
3 |
0 |
5,85 |
2 |
Решение
Рассмотрим первый этап моделирования (принятия решений).
Шаг 1.
Величина является ожидаемым доходом за один переход при выходе из состояния i и при выборе стратегии k. Таким образом:
Таблица 1.3
Результаты первого этапа моделирования
Стратегии |
Состояния |
Переходные вероятности |
Доходности |
Ожидаемые доходности |
|||||
1 |
2 |
3 |
1 |
2 |
3 |
||||
1 |
1 |
0,6 |
0,4 |
0 |
9,1 |
11,21 |
0 |
9,94 |
|
2 |
0,2 |
0,7 |
0,1 |
5,5 |
6,8 |
3,4 |
9,89 |
||
3 |
0 |
0,3 |
0,7 |
0 |
5,42 |
1,8 |
10,98 |
||
2 |
1 |
0,7 |
0,3 |
0 |
8,7 |
12,65 |
0 |
6,2 |
|
2 |
0,3 |
0,6 |
0,1 |
4,9 |
8,27 |
3,1 |
6,74 |
||
3 |
0 |
0,2 |
0,8 |
0 |
7,6 |
1,6 |
5,79 |
||
3 |
1 |
0,8 |
0,2 |
0 |
11 |
10,9 |
0 |
2,89 |
|
2 |
0,4 |
0,5 |
0,1 |
5,3 |
6,63 |
3,5 |
2,8 |
||
3 |
0 |
0,1 |
0,9 |
0 |
5,85 |
2 |
2,39 |
Оптимальным является такое поведение, которое максимизирует полный ожидаемый доход для всех состояний и шагов моделирования.
Шаг 2.
Полный ожидаемый доход вычисляется по следующей рекуррентной формуле:
Зададим
Вычислим полный ожидаемый доход для 1-ой стратегии на первом этапе моделирования:
Вычислим полный ожидаемый доход для 2-ой стратегии на первом этапе моделирования:
Вычислим полный ожидаемый доход для 3-ей стратегии на первом этапе моделирования:
Найдем максимальное значение полного ожидаемого дохода для каждого состояния для первого этапа моделирования:
Шаг 3.
Если система находится в «отличном» состоянии, то рекомендуется придерживаться 3-ой стратегии. Эта стратегия принесет доход на 1-ом этапе моделирования в размере 10,98 у.е.
Если же система находится в «удовлетворительном» состоянии, то рекомендуется также придерживаться 2 стратегии. Эта стратегия принесет доход на 1-ом этапе моделирования в размере 6,74 у.е.
Если же система находится в «неудовлетворительном» состоянии, то рекомендуется придерживаться 1 стратегии. Эта стратегия принесет доход на 1-ом этапе моделирования в размере 2,89 у.е.
Таким образом, d1(1) = 3, d2(2) = 2, d3(3) = 1.
Рассмотрим второй и третий этап моделирования (принятия решений), найдем полные ожидаемые доходности и решение аналогичным образом.
Таблица 1.4
Итоговая таблица выбора стратегий
-
n
0
1
2
3
v1(n)
0
10,98
21,11
30,74
v 2(n)
0
6,74
14,37
22,39
v 3(n)
0
2,89
6,93
12,05
d1(n)
-
3
3
3
d2(n)
-
2
2
2
d3(n)
-
1
1
1
Руководство пользователя разработанного приложения
Для начала необходимо ввести число состояний, число стратегий и количество этапов моделирования системы и нажать кнопку «Создать таблицу» (рис. 1).
Рисунок 1
Далее необходимо заполнить матрицу переходных вероятностей и матрицу доходностей (рис. 2).
Рисунок 2
После необходимо нажать на кнопку «Вычислить» (рис. 3).
Рисунок 3
Далее происходит вывод таблицы ожидаемой доходности, итоговой таблицы с результатами вычислений и графа состояний. Граф состояний отображается для выбранной стратегии (рис. 4).
Рисунок 4
Вывод
В ходе лабораторной работы был изучен рекуррентный метод дискретных марковских процессов и реализован алгоритм для решения конкретной задачи.