Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лек мат мет.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
1.54 Mб
Скачать

2.2.2. Принцип оптимальности и математическое описание динамического процесса управления

При решении задачи на каждом шаге выбирается управление, которое должно привести к оптимальному выигрышу. В многошаговых процессах управление на каждом конкретном шаге надо выбирать с учетом его будущих воздействий на весь процесс. Кроме этого следует учитывать возможные варианты состояния предыдущего шага.

В задачах ДП первое требование учитывают, делая на каждом шаге условные предположения о возможных вариантах окончания предыдущего шага и проводя для каждого шага условную оптимизацию. Выполнение второго требования обеспечивается тем, что в этих задачах условная оптимизация проводится от конца процесса к началу.

Условная оптимизация

Определяются функция Беллмана и оптимальные управления для всех возможных состояний на каждом шаге, начиная с последнего в соответствии с алгоритмом обратной прогонки. На последнем , n-ом шаге оптимальное управление -- х*n определяется функцией Беллмана

F(S)=max{Wn(S,xn)} xkX

В соответствии с которой максимум выбирается из всех возможных значений х , причем xkX .

Дальнейшие производятся согласно рекуррентному соотношению:

Fn(S)=max{Wn(S,xn)+Fk+1(S1(S,xk))} xkX

Этот максимум (или минимум) определяется по всем возможным для к и S значениям переменной управления Х.

Безусловная оптимизация.

Пользуясь тем , что на первом шаге (к=1) состояние системы известно – это ее начальное состояние S0, можно найти оптимальный результат за все n шагов и оптимальное управление на первом шаге х1 , после применения этого управления система перейдет в другое состояние S1(S,x*1), зная которое можно, пользуясь результатами условной оптимизации, найти оптимальное управление на втором шаге х*2 , и так далее до последнего n-го шага.

2.2.3. Оптимальное распределение инвестиций

Требуется распределить имеющиеся В единиц средств среди n предприятий, доход gi(xi) от которых в зависимости от количества вложенных средств хi определяется матрицей (n x n) приведенной в табл.1, так , чтобы суммарный доход со всех предприятий был бы максимальным.

Таблица 1

g1

g2

-

gi

-

gn

x1

g1(x1)

g2(x1)

gi(x1)

-

gn(x1)

x2

g1(x2)

g2(x2)

gi(x2)

-

gn(x2)

-

-

-

-

-

-

-

xn

g1(xn)

g2(xn)

-

gi(xn)

-

gn(xn)

Запишем математическую модель задачи.

Определить Х* = (х*1*2 ,… х*k ,… х*n ), удовлетворяющий условиям

n

xi=B

i=1

xi>=0, i=1,n

и обеспечивающий максимум целевой функции.

n

F(X)= gi(xi)-->max

i=1

Задача может быть решена путем перебора всех возможных вариантов распределения средств по n предприятиям. Но решим ее более эффективным способом, который заключается в следующем:

Разобьем процесс оптимизации на n шагов и будем на каждом к-ом шаге оптимизировать инвестирование не всех предприятий , а только предприятий с к-го по n-ое. При этом считаем, что в остальные предприятия (с 1-го по к-1) тоже вкладываются средства, и поэтому инвестирование предприятий с к-го по n-ое остаются не все средства , а сумма Ck<=B

Эта величина будет являться переменной состояния системы. Переменной управления на к-ом шаге назовем величину хk средств вкладываемых в к-ое производство. В качестве функции Беллмана Fk(Ck) на к-ом шаге можно выбрать максимально возможный доход, который можно получить с предприятий с к-го по n-ый при условии, что на их инвестирование осталось Ck средств. Очевидно, что при вложении в к-ое предприятие хk средств будет получена прибыль gk(xk) , а система к к+1-му шагу перейдет в состояние Sk+1 и , следовательно, на инвестирование предприятий с к-го по n-ое останется

Ck+1=(Ck-xk)

средств.

Т.o, на первом шаге условной оптимизации при к=n функция Беллмана представляет прибыль только n-го предприятия. При этом на его инвестирование может остаться средств Сn , 0<= С<= В, чтобы получить максимум прибыли с этого предприятия надо вложить в него все оставшиеся средства.

Fn(Cn)=gn(Cn) xn=Cn

На каждом последующем шаге для вычисления функции Беллмана необходимо использовать результаты предыдущего шага. Пусть на к-ом шаге для инвестирования предприятий с к-го по nосталось Ск средств, 0<= Ск<= В, тогда от вложения к-е предприятие хк средств будет получена прибыль gk(xk),а на инвестирование остальных предприятий с к-го по nCk+1=(Ck-xk).

Максимальный доход , который может быть получен с предприятий ( с к-го по n-е)

Fкк)=max{ gk(xk)+Fk+1(Ck-xk )} к=1,n

Максимум этого выражения достигается на некотором значении х*k . Действуя таким образом, можно определять функции Беллмана и оптимальные управления до шага к=1.

Значение функции Беллмана F1(C1) представляет собой максимально возможный доход со всех предприятий, а значение х*1 , на котором достигается максимум дохода, является оптимальным количеством средств, вложенных в первое предприятие. Далее на этапе безусловной оптимизации для всех последующих предприятий вычисляется величина Ck+1=(Ck-xk).

И оптимальное управление на к-ом шаге является то значение хk ,которое обеспечивает максимум дохода при соответствующем состоянии системы Sk .

Пример.

На развитие трех предприятий выделено 5 млн. руб. Известна эффективность капитальных вложений в каждое предприятие, заданная значением нелинейной функции gk(xk) представленной в таблице 2. Необходимо распределить выделенные средства между предприятиями таким образом, чтобы получить максимальный суммарный доход.

Для упрощения предполагаем, что распределение средств осуществляется в целых числах хk =(0,1,2,3,4,5) млн. руб.

Таблица 2

x

g1

g2

g3

0

0

0

0

1

2,2

2

2,8

2

3

3,2

5,4

3

4,1

4,8

6,4

4

5,2

6,2

6,6

5

5,9

6,4

6,9

Решение.

Условная оптимизация.

1-ый шаг,k=3. Предположим, что все средства в количестве х3 вложены в третье предприятие. В этом случае максимальный доход составит g3=6,9 тыс. руб., следовательно F3(C3)= g3(x3)

Таблица 3

С\X

0

1

2

3

4

5

F3(C3)

X*3

0

0

0

0

1

2,8

2,8

1

2

5,4

5,4

2

3

6,4

6,4

3

4

6,6

6,6

4

5

6,9

6,9

5

2-й шаг: Определяем оптимальную стратегию при распределении средств между вторым и третьим предприятиями. При этом рекуррентное соотношение Беллмана имеет вид:

F22)=max{ g2(x2)+F3(C2-x2)}

На основе которого составлена таблица 4.

Таблица 4

С\X

0

1

2

3

4

5

F2(C2)

X*2

0

0+0

0

0

1

0+2,8

2+0

2,8

0

2

0+5,4

2+2,8

3,2+0

5,4

0

3

0+6,4

2+5,4

3,2+2,8

4,8+0

7,4

1

4

0+6,6

2+6,4

3,2+5,4

4,8+2,8

6,2+0

8,6

2

5

0+6,9

2+6,6

3,2+6,4

4,8+5,4

6,2+2,8

6,4+0

10,2

3

Таблица 5

С\X

0

1

2

3

4

5

F1(C1)

X*1

0

0+0

0

0

1

0+2,8

2,2+0

2,8

0

2

0+5,4

2,2+2,8

3+0

5,4

0

3

0+7,4

2,2+5,4

3+2,8

4,1+0

7,6

1

4

0+8,6

2,2+7,4

3+5,4

4,1+2,8

5,2+0

9,6

1

5

0+10,2

2,2+8,6

3+7,4

4,1+5,4

5,2+2,8

5,9

10,8

1

Безусловная оптимизация.

Определяем компоненты оптимальной стратегии.

1-й шаг: По данным табл.5. максимальный доход при распределении5 млн. руб. между тремя предприятиями составляет С1=5, F1(C1)=10,8, при этом первому предприятию нужно выделить X*1=1 млн. руб.

2-й шаг.Определяем величину оставшихся средств, приходящих на долю второго и третьего предприятий.

С21*1=5-1=4 млн. руб.

По данным табл. 4 находим, что оптимальный вариант распределения средств размером 4 млн. руб. между вторым и третьим предприятиями составляет F2(C2)=8,6 при выделении второму предприятию X*2=2 млн. руб.

3-й шаг. Определяем величину оставшихся средств, приходящихся на долю третьего предприятия.

С32*2=4-2=2 млн. руб.

По данным табл. 3 находим: F3(C3)=5,4 и X*3=2 млн. руб.

Таким образом, оптимальный план инвестирования предприятий:

Х*=(1,2,2),

который обеспечит максимальный доход, равный:

F(5)=g1+ g2+g3=2,2+3,2+5,4=10,8 млн. руб.