Краткие теоретические сведения

1.1 Общая схема решения задач динамического программирования.

Для решения задач динамического программирования необходимо провести ее формализацию, а именно:

1. Определить этапы.

2. Определить на каждом этапе вариантов решения (альтернатив).

3. Определить состояния на каждом этапе.

Из перечисленных выше элементов понятие состояния, как правило, представляется весьма сложным для восприятия. Рассмотренные в этом разделе приложения последовательно показывают, что определение состояния меняется в зависимости от моделируемой ситуации. При рассмотрении каждого приложения полезно ответить на следующие вопросы.

1. Какие соотношения связывают этапы вместе?

2. Какая информация необходима для того, чтобы получить допустимые решения на текущем этапе без повторной проверки решений, принятых на предыдущих этапах?

Далее после формализации применяется какой-нибудь метод решения, например метод обратной прогонки. Далее рассмотрим некоторые виды задач, примеры их формализации и решения.

1.2. Азартная игра

1.2.1. Постановка задачи

Одна из разновидностей игры в русскую рулетку состоит во вращении колеса, на котором по его периметру нанесены п последовательных чисел от 1 до п. Вероятность того, что колесо в результате одного вращения остановится на цифре i, равна р,. Игрок платит х долларов за возможность осуществить т вращений колеса. Сам же игрок получает сумму, равную удвоенному числу, которое выпало при последнем вращении колеса. Поскольку игра повторяется достаточно много раз (каждая до т вращений колеса), требуется разработать оптимальную стратегию для игрока.

1.2.2. Формализация задачи

Формализация задачи для динамического программирования сводится к определению этапов, состояний и вариантов решения на каждом этапе. Для данной задачи формализация будет следующей:

Альтернативы	вращать/забрать деньги	забрать/вращать
Состояние	последнее выпавшее число	j
Этап	соответствует i-му вращению колеса	i

Пусть f_i(j) — максимум ожидаемой прибыли при условии, что игра находится на этапе (вращении) i и исходом последнего вращения есть число j. Имеем следующее:

Рекуррентное уравнение для f_i(j) можно записать следующим образом.

Обоснование рекуррентного уравнения сводится к следующему. При первом вращении колеса состоянием системы является , ибо игра только началась. Следовательно, После выполнения последнего вращения колеса имеется лишь один выбор — закончить игру независимо от исхода j т-го вращения. Следовательно,

Рекуррентные вычисления начинаются , заканчиваются при и сводятся таким образом к m+1 вычислительному этапу. Так как f₁(0) представляет собой ожидаемую прибыль от всех m вращений колеса, а игра обходится игроку в х долларов, имеем следующее.

Ожидаемая прибыль = f₁(0) – х.

1.2.3. Метод решения задачи

На каждом этапе составляются матрицы вида:

j	альт-ва 1	…	альт-ва N	f_i(j)	Решение
1
…
…
n

В столбце j содержатся состояния. В столбцах альтернатив содержатся возможные выигрыши при выборе данной альтернативы и данном текущем состоянии. В f_i(j) максимальный выигрыш. В стоблце Решение название альтернативы, которая дает максимальный результат.

В самом начале выбирается этап для которого нам известно, что будет выбрана одна единственная альтернатива. И далее используя рекурентные соотношения, производится итеративное построение матриц до тех пор пока не будет получена матрица соответствующая последнему рассматриваемому этапу. Ход работы данного метода целесообразно рассмотреть на примере.

<<< < Предыдущая 12 / 62 3 4 5 6 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
02.02.20152.55 Mб6Спецификация Власенко вариант 1 часть 2.docx
#
01.07.20252.67 Mб1Спир и ликеры.docx
#
01.05.20252.32 Mб2Список основных статей по линейной алгебре.doc
#
01.02.2015579.58 Кб9список стран.doc
#
02.02.2015336.38 Кб71СППР ЛабРаб 1 (Этапы. Decision Explorer).doc
#
01.03.2025434.18 Кб1СППР_Лб5.doc
#
02.02.201519.71 Mб49Справочник первокурсника.pdf
#
01.07.202528.03 Mб9Справочный материал.doc
#
01.07.2025193.93 Кб1СПРС Мікроб. М -20-23.docx
#
02.02.201545.06 Кб64Средневековая европейская культура.docx
#
01.05.201961.95 Кб3Средства массовой информации в системе заклинан....doc