Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Балтийский федеральный университет им. И.Канта

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

__Динамическое программирование_специалитет.doc

Скачиваний:

Добавлен:

01.05.2025

Размер:

2.74 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 249 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 > Следующая >>>

Тема 6. Динамическое программирование и линейное программирование

План лекции:

Задачи оптимизации производства услуг.

Задача оптимального распределения ресурсов.

Краткое содержание лекции

Повышение эффективности вычислений при решении определенного класса задач математического программирования может быть достигнуто путем использования методов динамического программирования. Особенностями методов динамического программирования являются использование для их реализации принципов инвариантного погружения и оптимальности. Принцип инвариантного погружения предполагает замену общей задачи на эквивалентную совокупность более простых (пошаговых) задач. Принцип оптимальности определяет возможность получения глобально-оптимальных стратегий (решений) на основе решений пошаговых задач оптимизации. Методы динамического программирования позволяют существенно сократить (по сравнению с полным перебором) число анализируемых вариантов решений в процессе определения глобально-оптимального решения за счет учета априорной информации о решениях, не являющихся допустимыми, и использования информации, полученной на предыдущих шагах оптимизации. Кроме того, достоинством методов динамического программирования является их инвариантность к классу целевой и ограничительных функций.

В распределительных задачах с большим числом различных результатов производственной деятельности (i=1,…,n) и видов ресурсов (j=1,…,m) общее решение задачи оптимизации может быть при определенных условиях заменено совокупностью последовательно решаемых менее сложных частных задач оптимизации, например, по каждому из отдельных видов производственной деятельности. При этом важными понятиями ДП являются: последовательность шагов оптимизации, состояние системы распределения ресурсов и варианты решения (области изменения оптимизируемых переменных)

Рассмотрим приемы и методы динамического программирования и введенных выше понятий на примере общей задачи линейного программирования:

z =c₁x₁+c₂x₂+…+c_nx_n  max,

a₁₁x₁+a₁₂x₂+…+a_1nx_n  b₁,

a₂₁x₁+a₂₂x₂+…+a_2nx_n  b₂,

…

a_m1x₁+a_m2x₂+…+a_mnx_n  b_m,

x₁,…,x_n0,

где z - целевая функция, подлежащая максимизации;

x_i - оптимизируемые переменные;

i=1,n-номер оптимизируемой переменной;

с_i - доход от реализации i-го вида производственной деятельности;

j=1,m-номер ограничений на значения переменных;

а_ij - коэффициенты уравнений-ограничений;

b_j - величина j-го ресурса (правая часть ограничений).

Здесь каждый вид производственной деятельности i может рассматриваться как отдельный шаг оптимизации; множество возможных значений переменных (допустимая область решений) x_i как варианты решений, а количество каждого j-го вида ресурса (B_i1,…, B_ij,… B_im), 0b_jB_ij, доступного для распределения на текущем и предыдущих (либо текущем и последующих) шагах (по i-м типам деятельности) как состояние модели.

Тогда оптимальное значение целевой функции z для шагов i,i+1,…,n при заданных состояниях {B_ij} может быть записано в виде следующей рекуррентной функции Беллмана (алгоритма прямой прогонки):

f_i(B_i₁,…, B_im) = max {c_i x_i+ f_i_-1(B_i₁-a_i₁x_i,…,B_im-a_imx_i )}, i =1,n;j =1,m,

где 0a_ijx_iB_ij

с начальными условиями f₀(B₀₁,…,B_0m)=0.

Оптимальное значение целевой функции в обратном времени для шагов n,…, i, i-1,…,1 при заданных состояниях {B_ij} может быть записано в виде следующего алгоритма обратной прогонки:

f_n(B_n1,…,B_nm)=max{c_nx_n}, 0a_njx_nB_nj

f_i(B_i1,…,B_im)=max {c_ix_i+f_i+1(B_i1-a_i1x_i,…,B_im-a_imx_i)}, i=1,n; j=1,m,

где 0a_ijx_iB_ij0B_ijb_j.

Разница между прямым и обратным способами решения задачи заключается в определении состояния модели. В прямой модели B_ij - количество ресурса j-го типа, распределяемого от первого шага до i-го, а для обратной модели B_ij- количество ресурса, распределяемого на всех шагах от i-го до n-го.

Решение первой задачи основывается на двух основополагающих принципах. Принципе инвариантного погружения, определяющем декомпозицию решения общей задачи на пошаговое решение частных (для каждого вида производственной деятельности) задач, объединяемых общим ресурсом. Принципе оптимальности, определяющем независимость решений, получаемых на текущем шаге оптимизации, от решений, полученных на предыдущих (последующих) шагах, а лишь их зависимость от цели оптимизации и состояния ресурсов на i-м шаге. При этом гарантируется оптимальность глобальной стратегии (последовательности решений) при оптимальных локальных (пошаговых) решениях.

Процесс решения задачи методом динамического программирования включает два этапа. На первом этапе пошаговые задачи оптимизации приводят к условно-оптимальным по ресурсу (состояниям) решениям и одному (конечному) безусловно-оптимальному решению. На втором этапе формируется окончательная безусловно-оптимальная стратегия (x₁^опт,…,x_i^опт,…,x_n^опт) путем учета полученного на первом этапе конечного решения и затрат ресурсов на его реализацию, а также обратного по шагам анализа множества условно-оптимальных решений и выделения из него оптимальной стратегии.

Рассмотрим методику реализации принципа оптимальности на примере задачи оптимизации производства услуг в сети спутниковой связи. Пусть для сети спутниковой связи необходимо оптимизировать производство услуг двух типов: x_aи x_б по критерию вида

max z = 3x_a + 2x_б, при ограничениях

x_а + 2x_б  6,

2x_а + x_б  8,

-x_а + x_б  1,

x_б  2,

[x_а] ,[x_б]  0.

Здесь шаги оптимизации определяются порядком оптимизации различных видов услуг связи: на 1^ом шаге i=1 оптимизируется число услуг типа а, на втором шаге i=2 оптимизируется число услуг типа б.

Вектор состояния (B_i1,B_i2) определяется двумя видами ресурсов: числом телеграфных и телефонных каналов, подлежащих распределению на i-м шаге, т.е.0B_i16 и 0B_i28. Варианты решений определяются допустимой областью определения переменных x_i, подлежащих оптимизации. Далее рассмотрим реализацию алгоритма ДП для случая обратного алгоритма.

Критерий оптимальности для первого шага (оптимизация производства услуги x_б) принимает вид:

f₂(B₂₁,B₂₂)= max{2x_б},

0  2x_б  B₂₁

0  x_б  B₂₂

Далее определяем допустимые границы изменения состояния на первом шаге:

Процесс поиска условно оптимальных решений по величине производства услуги x_б отобразим в форме таблицы.

Таблица

						Оптимальное решение
	X_б=0	X_б=1	X_б=2	X_б=3	X_б=4	f^*₂(B₂)	x^*_б
(2,0)	0	-	-	-	-	0	0
(3,2)	0	2	-	-	-	2	1
(4,4)	0	2	4	-	-	4	2
(5,6)	0	2	4	-	-	4	2
(6,8)	0	2	4	6	-	6	3

Второй шаг алгоритма оптимизации связан с отысканием безусловного решения по производству услуги x_а при ограничениях на состояние ресурсов, выделенных на оба шага оптимизации .

Целевая функция на втором шаге имеет следующий вид:

f₁(B₁) = max{R₁(x_а) + f₂(B₁ – C₂(x^*_б))}, при 0x_аB₁₁; 02x_аB₁₂

Решение задачи второго этапа представлено таблицей.

Таблица

	R₁(x_а) + f₂(B₁ – C₂(x^*_б))					Оптимальное решение
	X_a=0	X_a=1	X_a=2	X_a=3	X_a=4	f^*₁(B₁)	x^*_а
(6,8)	0+6=6	3+4=7	6+4=10	9+2=11	12+0	12	4

Выполнение второго этапа предполагает определение на основе полученного безусловного решения x^*_а = 4 состояния ресурса, оставшегося только на первый шаг , и отыскание из таблицы 2 второго безусловного решения, удовлетворяющего этому ограничению x^*_б = 0.

Второй вариант аналитического решения этой же задачи на основе использования информации заключенной в ограничениях на множество оптимизируемых переменных представлен ниже. В этом случае решение также реализует алгоритм обратной прогонки.

Первый этап. Для оптимизации производства второго вида услуги x_б целевая функция на первом шаге имеет следующий вид:

f₂(B₂₁,B₂₂)= max{2x_б}

02x_бB₂₁

0x_бB₂₂

Так как из ограничений следует, что x_б  min{B₂₁/2,B₂₂}, а f₂(x_б|B₂₁,B₂₂) = 2x_б, то, подставляя первое во второе и переходя к максимуму целевой функции, получим

f₂(B₂₁,B₂₂) = max{f₂(x_б|B₂₁,B₂₂) = 2x_б = 2min{B₂₁/2,B₂₂},

откуда x^*_б = min{B₂₁/2,B₂₂}.

Т.е. оптимальное значение числа услуг типа б, получаемое на шаге 1 , равно минимальному из двух видов ресурсов (числу телеграфных B₂₁/2 или телефонных каналов B₂₂), распределяемых на первом шаге.

Далее для шага 2 имеем:

f₁(B₁₁,B₁₂) = max {3x_a+f₂(B₁₁-x_a,B₁₂-2x_a)}= max {3x_a+2min{(B₁₁-x_a)/2,B₁₂-2x_a}}, 0x_aB₁₁; 02x_aB₁₂, где B₁₁=6 и B₁₂=8 для первого шага оптимизации.

Подставляя значение ресурсов ТГ и ТФ каналов в ограничения, получим обобщенное ограничение в виде x_a  min(B₁₁,B₁₂/2)=4. Учитывая пропорциональную зависимость значения целевой функции от значения x_a последнее неравенство превращается в равенство, а соответствующее решению x_a^*= 4 оптимальное (максимальное) ее значение f₁^*(4) = 12.

Второй этап. Безусловное решение на первом шаге оптимизации числа предоставляемых услуг x_б необходимо проводить для следующего состояния по ресурсам:

B₂₁ = B₁₁- x_a^*=6-4=2; B₂₂ = B₁₂- 2x_a^* =8-8=0.

Откуда из условного решения следует безусловное: x_б^*= min { B₂₁/2, B₂₂ }= min { 1, 0 }= 0 . Таким образом, пошаговое решение задачи линейного программирования методом динамического программирования обеспечило в целом оптимальную стратегию производства услуг в одну единицу времени x_a= 4 , x_б = 0 при максимальном для случая целочисленного решения значении дохода сети спутниковой связи z = 12 у.е./ед.вр.

Пример. Задача оптимального распределения ресурсов резервирования в радиорелейной линии связи. Рассмотрим радиорелейную линию, состоящую из n интервалов. В случае независимых технических отказов различных интервалов вероятность безотказной работы всей РРЛ определяется выражением:

где P_i –вероятность безотказной работы i-го интервала.

Для повышения надежности данной последовательной системы используется резервирование станций на каждом из отдельных интервалов РРЛ, вероятность безотказной работы которых определяется выражением:

где q_iи p_i –вероятность отказа и вероятность безотказной работы элемента на i-м интервале соответственно; x_i- число резервных станций на i-м интервале; 1+x_i –общее число (одна рабочая и x_i резервная) станций в i-м интервале. Пусть также введены ограничения на число резервных станций x_i  2;i=1,n. При этом суммарная стоимость резервных элементов с учетом известных ограничений на число станций в подразделении, развертывающем РРЛ не может превысить величины С_ = 1200у.ед. Остальные исходные данные, содержащие сведения о надежности p_i(x_i) и стоимости резервных средств c_i(x_i) i-го интервала, даны в таблице.

x_i

i=1

i=2

i=3

p₁(x_i)

C₁(x_i)

p₂(x_i)

C₂(x_i)

p₃(x_i)

C₃(x_i)

0,70

0,91

0,973

100

200

300

0,60

0,84

0,936

200

400

600

0,50

0,75

0,875

300

600

900

В указанной таблице значения вероятностей безотказной работы i-х интервалов при использовании в них x_i резервных станций определяются из выражения p_i(x_i) = 1-(1-p_i)¹⁺^x_i, где p_i-вероятность безотказной работы интервала при отсутствии резерва. Необходимо определить оптимальное количество резервных станций на каждом интервале x_i^опт , обеспечивающих максимальную надежность РРЛ, т.е.

при ограничениях

Для решения этой нелинейной задачи применим метод динамического программирования и, в частности, алгоритм обратной прогонки. При этом номер шага соответствует номеру интервала, под состоянием s_i (0s_iC_) понимается суммарная стоимость основного и резервного оборудования, задействованного на i-м и последующих интервалах, а под вариантами решения x_i понимаем допустимое число резервных элементов в i-м интервале. Рекуррентное соотношение для функции Беллмана в данном случае может быть записано в виде:

F_n(s_n) = ,

F_i(s_i) = ,

s_i = C_ - , k = 1, i = 1, 2, …, n-1.

Из таблицы найдем границы изменения состояния s_i на каждом шаге:

s_3min=c₃(x₃=0)=300у.е.,

s_3max=С_ - = C_ - [c₁(x₁ = 0) + c₂(x₂ = 0)] = 1200 – 300 = 900у.е.,

s_2min=c₂(x₂ = 0) + c₃(x₃ = 0) = 200 + 300 = 500у.е.,

s_2max=C_ - c₁(x₁ = 0)=1200 – 100 = 1100у.е., s₁=C_ = 1200у.е.

На первом этапе обратного алгоритма рассматривают шаг 3. Найденные на этом и последующих этапах значения критерия и условно-оптимальные решения для всех допустимых значений s_i и оптимизируемых переменных x_i=0,1,2 представлены в нижеследующих таблицах.

Шаг 3

S₃	P₃(X₃)			Условное оптимальное решение
	X₃=0	X₃=1	X₃=2	F₃(s₃)	X₃^опт
	P=0,5 C₃=300	P=0,75 C₃=600	P=0,875 C₃=900	F₃(s₃)	X₃^опт
300 400 500 600 700 800 900	0,5 0,5 0,5 0,5 0,5 0,5 0,5	- - - 0,75 0,75 0,75 0,75	- - - - - - 0,875	0,5 0,5 0,5 0,75 0,75 0,75 0,875	0 0 0 1 1 1 2

Шаг 2

S₂	P₂(X₂)=p₂(x₂) F₃(s₂-c₂(x₂))			Условное оптимальное решение
	X₂=0	X₂=1	X₂=2	F₂(s₂)	X₂^опт
	P=0,6 C₂=200	P=0,84 C₂=400	P=0,936 C₂=600	F₂(s₂)	X₂^опт
500 600 700 800 900 1000 1100	0,3 0,3 0,3 0,45 0,45 0,45 0,525	- - 0,42 0,42 0,42 0,63 0,63	- - - - 0,468 0,468 0,468	0,3 0,3 0,42 0,42 0,468 0,63 0,63	0 0 1 1 2 1 1

Здесь значения функции Беллмана на втором шаге определяются с учетом ее значения на предыдущем шаге согласно выражению F_i(c_i)= p_i(x_i)F_i+1(C_ - c_i).

Шаг 3

S₁=C_	P₁(X₁)=p₁(x₁)F₂(c₂)			Безусловное оптимальное решение
	X₁=0	X₁=1	X₁=2	F₁(s₁)	X₁^опт
	P=0,7 C₁=100	P=0,91 C₁=200	P=0,973 C₁=300	F₁(s₁)	X₁^опт
1200	0,441	0,5733	0,4554	0,5733	1

Безусловное оптимальное решение на первом этапе получено лишь для шага 3 (числа резервных станций на первом интервале x₁^опт=1), поэтому окончательная стратегия относительно необходимых резервных станций в каждом из трех интервалов может быть получена лишь на втором этапе – этапе анализа результатов пошаговой оптимизации.

Так как x₁^опт=1, то величина ресурса, подлежащая распределению на первом и втором шагах будет равно S₂ = C_ - c(x₁) = 1200 - 200 = 1000у.е. Тогда из предпоследней таблицы для S₂=1000 получим оптимальное число резервных станций во втором интервале: x₂^опт=1. Следовательно, состояние S₃=C_ - c(x₁^опт) + c(x₂^опт) = 1200 – (200 + 400) = 600у.е. Наконец, из последней таблицы для S₃=600 имеем оптимальное число резервных станций на третьем интервале: x₃^опт=1.

Окончательно, оптимальная стратегия распределения резерва имеет вид: , т.е. на каждом радиорелейном интервале должно находиться по одной резервной радиорелейной станции. Вероятность безотказной работы РРЛ при этом составляет P_РРЛ= 0,5733; суммарные затраты и затраты по интервалам составляют C_=1200; С₁=200; С₂=400; С₃=600у.е. Интервальные вероятности безотказной работы составляют p₁(x₁=1)=0,91; p₂(x₂=1)=0,84; p₃(x₃=1)=0,75.

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 249 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
20.12.2018190.98 Кб5zhukovsky.doc
#
28.08.2019246.27 Кб6Ziza_E_N_Metodicheskoe_posobie_2-_versia_2.doc
#
10.02.2015486.77 Кб10zolov.pdf
#
01.05.2025268.8 Кб0_gs_de_f8_48_32268-126305815946072.doc
#
01.05.202582.94 Кб0_images_metodichka_po_proektam.doc
#
01.05.20252.74 Mб3__Динамическое программирование_специалитет.doc
#
01.07.20251.79 Mб4_Ференци Шандор, Тело и подсознание.doc
#
01.05.202566.42 Кб0А ЦНС.docx
#
01.11.2018696.83 Кб147А.В.Гармаш, Н.М.Сорокина - Метрологические осно....doc
#
10.02.20156.66 Mб15А.Н. Головистикова, Ю.А. Дмитриев.doc
#
10.02.20152.78 Mб261А.Х.Саидов. Сравнительное правоведение.doc