- •1. Краткие теоретические сведения
- •1.1 Общая схема решения задач динамического программирования.
- •1.2. Азартная игра
- •1.2.1. Постановка задачи
- •1.2.2. Формализация задачи
- •1.2.3. Метод решения задачи
- •1.2.4. Пример
- •1.3. Вероятностная задача инвестирования
- •1.4. Максимизация вероятности достижения цели
- •1.5. Классическая задача экономичного размера заказа
- •1.6. Задача экономичного размера заказа с разрывами цен
- •1.7. Многопродуктовая статическая модель с ограниченной вместимостью склада
- •1.8. Модель с затратами на оформление заказа
- •2. Задание на лабораторную работу
- •3. Варианты заданий
1.2.4. Пример
Постановка задачи
n=8, p(i)=1/8, x=5, m=3.
Формализация
-
Альтернативы
вращать/забрать деньги
забрать/вращать
Состояние
последнее выпавшее число
j
Этап
соответствует i-му вращению колеса
i
Рекуррентные соотношения
Ход решения
В качестве первого рассматриваемого этапа будем считать третий этап, т.к. нам достоверно известно, что на этом этапе придется забрать деньги при любом выпавшем числе.
3этап
j |
Забрать |
Вращать |
f3(j) |
Решение |
1 |
2 |
- |
2 |
Забрать |
2 |
4 |
- |
4 |
Забрать |
3 |
6 |
- |
6 |
Забрать |
4 |
8 |
- |
8 |
Забрать |
5 |
10 |
- |
10 |
Забрать |
6 |
12 |
- |
12 |
Забрать |
7 |
14 |
- |
14 |
Забрать |
8 |
16 |
- |
16 |
Забрать |
2этап
j |
Забрать |
Вращать |
f2(j) |
Решение |
1 |
2 |
9 |
9 |
Вращать |
2 |
4 |
9 |
9 |
Вращать |
3 |
6 |
9 |
9 |
Вращать |
4 |
8 |
9 |
9 |
Вращать |
5 |
10 |
9 |
10 |
Забрать |
6 |
12 |
9 |
12 |
Забрать |
7 |
14 |
9 |
14 |
Забрать |
8 |
16 |
9 |
16 |
Забрать |
Выигрыши для столбца Вращатьпри любом текущем состоянии будут равны матожиданию выигрыша на 3 этапе, т.е.,
1этап
j |
Забрать |
Вращать |
f1(j) |
Решение |
1 |
2 |
11 |
11 |
Вращать |
2 |
4 |
11 |
11 |
Вращать |
3 |
6 |
11 |
11 |
Вращать |
4 |
8 |
11 |
11 |
Вращать |
5 |
10 |
11 |
11 |
Вращать |
6 |
12 |
11 |
12 |
Забрать |
7 |
14 |
11 |
14 |
Забрать |
8 |
16 |
11 |
16 |
Забрать |
Ожидаемая прибыль = матожидание - стоимость игры, т.е.
Ожидаемая прибыль =
Оптимальная стратегия
|
Выпавшее число | |||||||
---|---|---|---|---|---|---|---|---|
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
Вращение 1 |
Вращать |
Вращать |
Вращать |
Вращать |
Вращать |
Забрать |
Забрать |
Забрать |
Вращение 2 |
Вращать |
Вращать |
Вращать |
Вращать |
Забрать |
Забрать |
Забрать |
Забрать |
Вращение 3 |
Забрать |
Забрать |
Забрать |
Забрать |
Забрать |
Забрать |
Забрать |
Забрать |
1.3. Вероятностная задача инвестирования
Некто планирует инвестировать С тысяч долларов через фондовую биржу в течение последующих и лет. Инвестиционный план состоит в покупке акций в начале года и продаже их в конце этого же года. Накопленные деньги затем могут быть снова инвестированы (все или их часть) в начале следующего года. Степень риска инвестиции представлена тем, что прибыль имеет вероятностный характер. Изучение рынка свидетельствует о том, что прибыль от инвестиции зависит отm условий рынка (благоприятных или неблагоприятных). При этом условиеiприводит к прибылиri с вероятностьюрi, i=1, 2, ...,т. Как следует инвестироватьСтысяч долларов для наибольшего накопления к концуп лет?
Обозначим
xi — сумма денежных средств, доступных для инвестирования в началеi-го года (x1=C),
уi — сумма реальной инвестиции в началеi-го года (уi<хi).
Элементы модели ДП можно описать следующим образом.
Этап i представляетi-й год инвестирования.
Альтернативами на этапеi являются величиныyi.
Состояние системы на этапеiописывается величинойхi.
Пусть fi(xi) — максимальная ожидаемая сумма поступления денежных средств за года отiдоnпри условии, что в началеi-го года имеется суммахi. Дляk-го условия рынка имеем следующее.
хi+1=(1+rk)yi+(хi–уi)=rkyi+xi, k=1,2,...,m.
Так как вероятность k–го условия рынка равнарk, рекуррентное уравнение динамического программирования имеет следующий вид.
где fn+1(xn+1)= xn+1, так как послеn-го года инвестиции нет. Отсюда следует, что
поскольку функция в фигурных скобках является линейной по уn и, следовательно, достигает своего максимума приуn=хn.