Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
MU_po_SR_po_dists_MOR_polnaya_ZO.docx
Скачиваний:
3
Добавлен:
01.07.2025
Размер:
2.92 Mб
Скачать

§4. Общая схема применения метода дп. Задача об оптимальном распределении ресурсов между отраслями на п лет

Прежде чем перейти к конкретным задачам, следует усвоить общую схему применения метода ДП.

Предположим, что все требования, предъявляемые к задаче методом ДП, выполнены. (Эти требования сформулированы в §1). Построение модели ДП и применение метода ДП для решения сводится к следующим моментам:

1. Выбирают способ деления процесса управления на шаги.

2. Определяют параметры состояния Sk и переменные управления Xk на каждом шаге.

3. Записывают уравнения состояний.

4. Вводят целевые функции k-го шага и суммарную целевую функцию.

5. Вводят в рассмотрение условные максимумы (минимумы) и условное оптимальное управление на м шаге: , .

6. Записывают основные для вычислительной схемы ДП уравнения Беллмана для и .

7. Решают последовательно уравнения Беллмана (условная оптимизация) и получают две последовательности функций: и .

8. После выполнения условной оптимизации получают опти­мальное решение для конкретного начального состояния S0:

а) Zmах= (S0) и

б) по цепочке S0      …     оптимальное управление: =( , , …, ).

Решая задачи, следует по возможности придерживаться этой схемы по крайней мере в начале изучения темы. Рассмотрим, как работает схема на примере задачи об оптимальном распределении ресурсов между двумя отраслями на п лет.

2. Планируется деятельность двух отраслей производства на п лет. Начальные ресурсы S0. Средства х, вложенные в I отрасль в начале года, дают в конце года прибыль f1(х) и возвращаются в размере q1(х)<х; аналогично для II отрасли функция прибыли равна f2(х), а возврата — q2(х) (q2(х)<х). В конце года все возвращенные средства заново перераспределяются между I и II отраслями, новые средства не поступают, прибыль в производство не вкладывается.

Требуется распределить имеющиеся средства S0 между двумя отраслями производства на п лет так, чтобы суммарная прибыль от обеих отраслей за п лет оказалась максимальной.

Необходимо:

а) построить модель ДП для задачи и вычислительную схему;

б) решить задачу при условии, что S0=10000 ед., п=4, f1(х)=0,6х, q1(х)=0,7x, f2(х)=0,5x, q2(х)=0,8х.

Решение. а) Процесс распределения средств между двумя отраслями производства разворачивается во времени, решения принимаются в начале каждого года, следовательно, осуществляется деление на шаги: номер шага — номер года. Управляемая система — две отрасли производства, а управление состоит в выделении средств каждой отрасли в очередном году. Параметры состояния к началу k-го года — Sk1 (k=1, 2, ..., п) — количество средств, подлежащих распределению. Переменных управления на каждом шаге две: хk — количество средств, выделенных I отрасли, и yk — II отрасли. Но так как все средства Sk1 распределяются, то yk=Sk1хk и поэтому управление на k-м шаге зависит от одной переменной хn, т.е. Хk(хk, Sk1хk).

Уравнения состояний

Sk=q1(хk)+q2(Sk1хk) (4.1)

выражают остаток средств, возвращенных в конце k-го года.

Показатель эффективности k-го шага — прибыль, полученная в конце k-го года от обеих отраслей:

f1(хk)+f2(Sk1хk) (4.2)

Суммарный показатель эффективности — целевая функция задачи — прибыль за п лет:

Z= (хk)+f2(Sk1хk) (4.3)

Пусть (Sk1) — условная оптимальная прибыль за nk+1 лет, начиная с k-го года до n-го года включительно, при условии, что имеющиеся на начало k-го года средства Sk1 в дальнейшем распределялись оптимально. Тогда оптимальная прибыль за п лет Zmах= (S0).

Уравнения Беллмана имеют вид:

(Sn1)= {f1(xn)+f2(Sn1хn)}, (4.4)

(Sk1)= {f1(xk)+f2(Sk1хk)+ (Sk)}, (k=n1, n2, …, 2) (4.5)

б) Используем конкретные данные.

Уравнение состояний (4.1) примет вид:

Sk=0,7хk+0,8(Sk1хk) или Sk=0,8Sk10,1хk (4.6)

Целевая функция k-го шага (4.2)

0,6хk+0,5(Sk1хk)=0,1хk+0,5Sk1.

Целевая функция задачи

Z= Sk1+0,1хk (4.7)

Функциональные уравнения

(S3)= {0,5S3+0,1х4}, (4.8)

(Sk1)= {0,1хk+0,5Sk1+ (Sk)}, (4.9)

Проводим условную оптимизацию.

IV шаг. Используем уравнение (4.8). Обозначим через Z4 функцию, стоящую в скобках, Z4=0,5S3+0,1х4; функция Z4 — линейная, возрастающая, так как угловой коэффициент 0,1 больше нуля. Поэтому максимум достигается на конце интервала [0; S3] (рис. 12.5). Следовательно, (S3)=0,6S3 при (S3)=S3.

III шаг. Уравнение:

(S2)= {0,1х3+0,5S2+0,6S3}.

Найдем S3 из уравнений состояний (4.6): S3=0,8S20,1х3 и, подставив его выражение в правую часть уравнения, получим

(S2)= {0,1х3+0,5S2+0,6(0,8S20,1х3)},

(S2)= {0,04х3+0,98S2}.

Как и в предыдущем случае, максимум достигается при х3=S2, т.е. (S2)=1,02S2 при (S2)=S2.

II ш а г. Из уравнения состояния: S2=0,8S10,1х2. Поэтому уравнение (4.8) при k=2 примет вид:

(S1)= {1,316S10,002x2}.

Линейная относительно x2 функция =1,316S10,002x2 убывает на отрезке [0; S1], и поэтому ее максимум достигается при x2=0: (S1)=1,316S1 при (S1)=0.

I шаг. S1=0,8S00,1х1. Уравнение (4.8) при k=1 имеет вид:

(S0)= {1,5528S00,0316x1}.

Как и в предыдущем случае, максимум достигается в начале отрезка, т.е.

(S0)=1,5528S0 при (S0)=0.

На этом условная оптимизация заканчивается. Используя ее результат и исходные данные, получим Zmах= (10000), Zmах=15528.

=0, =S0=10000

(все средства выделяются II отрасли) 

 =0,8100000,10=8000  =0, =S1=8000

(все средства выделяются II отрасли) 

 =0,880000,10=6400  =6400, =0 

(все средства выделяются I отрасли) 

 =0,864000,16400=4480  =4480, =0

(все средства выделяются I отрасли).

Оптимальная прибыль за 4 года, полученная от двух отраслей производства при начальных средствах 10000 ед., равна 15528 ед. при условии, что I отрасль получает по годам (0; 0; 6400; 4480), а II отрасль — соответственно (10000; 8000; 0; 0).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]