
- •Запишите рекуррентные соотношения Беллмана для задачи о замене оборудования.
- •Дайте определение унимодальной функции.
- •Какая идея лежит в основе методов сечений для отыскания экстремума унимодальной функции?
- •Какой сп называется полумарковским?
- •Какой сп называется процессом гибели и размножения?
- •Динамическое программирование: предмет исследования, математическая модель многошагового процесса.
- •Математическое программирование: предмет исследования, общие сведения о численных методах отыскания экстремумов.
- •Метод множителей Лагранжа.
- •Численные методы: общая характеристика методов отыскания экстремума функции одной переменной.
- •Численные методы одномерной минимизации: метод квадратичной интерполяции.
- •Численные методы одномерной минимизации: методы первого и второго порядка.
- •Отыскание экстремума функции n переменных. Градиент, линия уровня, их свойства.
- •Отыскание экстремума функции n переменных. Общая схема методов спуска.
- •Методы наискорейшего и покоординатного спуска для отыскания экстремума функции n переменных.
- •Решение задач математического программирования путем сведения их к задачам безусловного экстремума. Метод штрафных функций.
- •Решение задач математического программирования путем сведения их к задачам безусловного экстремума. Метод барьерных функций.
- •Понятие случайного процесса, классификация.
- •Дискретные цепи Маркова: определение, матрица переходных вероятностей, уравнение Чепмена-Колмогорова.
- •Дискретные цепи Маркова: стационарное распределение вероятностей.
- •Дискретные цепи Маркова: распределение времени пребывания в одном и том же состоянии.
- •Процессы гибели и размножения. Уравнения Чепмена-Колмогорова.
Динамическое программирование: предмет исследования, математическая модель многошагового процесса.
К динамическому программированию относят задачи, которые по своей природе являются многошаговыми, либо задачи, кот. можно свести к многошаговым.
ЗДП: игровые, экономические, ряд задач техн. характера.
Задачи, кот. сводятся к ЗДП: экономические, технические, непрерывные задачи.
Задача распределения ресурсов: постановка и анализ (вывод соотношений Беллмана). В состав некоторого объединения входит N предприятий. Объединение обладает ресурсами в кол-ве b единиц. Эти ресурсы объединение распределяет м/ду предприятиями. Рез-том вложения ресурсов в каждое предприятие явл. прибыль, кот. получает объединение. Эта прибыль зависит как от конкретного предприятия, так и от кол-ва вложенных ресурсов. fi(xi) – прибыль, где xi – кол-во ресурсов, кот. выделяется i-ому предприятию. Ставится задача: распределить ресурсы м/ду предприятиями т.о., чтобы суммарная прибыль была max.
xi
fi(xi)
f1(x1)+f2(x2)+…+fN(xN) -> max – суммарная прибыль
(1)
xi≥0, i=1,N
f(x1,x2,…,xN)= f1(x1)+f2(x2)+…+fN(xN) – сепаравельная ф-ция
в силу этого задачу (1) относят к типу сепаравельного программирования. Задачу (1) можно решить средствами матем. программирования, если представить ее в виде многошагового процесса, т.е. на первом этапе выделяют ресурсы для 1-го предпр.; на 2-ом – для 2-го предпр.
Ф-ции fi(xi) могут задаваться аналитически
Δb
b=100
b≤10
0,10,20,…,90,100
Принцип инвариантного погружения
k 1≤k≤N
y 0≤y≤b
y=0, Δb
, 2Δb,...,b
Принцип оптимальности
Fk(y) – максимальная прибыль пред-я от распределения y единиц ресурсов м/ду k-предприятиями.
k=1 y f1(y)=>F1(y)=f1(x1)
Fk(y)->Fk+1(y)

xk+1: F(y-xk+1)fk+1(xk+1)
Fk+1(y)=max (Fk(y-xk+1)+fk+1(xk+1))
0≤xk+1≤y (2)
F1(y)=f1(x1)
Соотношение (2) назыв. рекурентными
fk(y) – ф-ция Белмона
Соотношение (2) последовательно позволяет построить ф-цию Белмона для k=1,2,3,…
Процесс построения ф-ции fk(y) для k=1,2,3,…, назыв. прямым ходом метода динамического программирования.
Задача о замене оборудования: постановка и анализ (вывод соотношений Беллмана)). Предприятие на однотипном оборудовании производит некоторую продукцию. В зависимости от возраста оборудования меняется кол-во производимой продукции и затраты на обслуживание оборудования. Для характеристики работы оборудования исп. 2 величины: u(t) – сумма продукции (доход) V1 производимой в течении года, если возраст оборудования составляет z лет; v(t) – затраты на эксплуатацию и ремонт оборудования в течении года, если возраст оборудования в начале этого года составляет t лет. В начале каждого года рук-во предприятия принимает решение: производить ли продукцию в течении след. Года на старом оборудовании иди демонтировать это оборудование, продать по остаточной цене и заменить новым. При принятии этого решения учитывается, что на покупку нового оборудования необходимо p денежных единиц. Составить план оптимальной замены оборудования на промежутке T лет, если в начале этого промежутка возраст оборудования t0 лет.
t0
t0+1
t0+2
0 1 2 T
u(t)- r(t) – прибыль
Анализ задачи
1≤k≤T
0≤t0≤T
Т.е. мы рассматриваем T(T+1) однотипных задач.
Введем ф-цию Белмона: Fk(t) – выражает max прибыль предприятия на промежутке k лет, если возраст оборудования в начале этого промежутка t лет.
k=1


t
0 1

u(t)-r(t) (1)
S(t)-p+u(0)-r(0)
Рассм. k+1
u(t)-r(t) Fk(t+1)
0 1 k k+1
Fk(t)
S(t)-p+u(0)-r(0) Fk(1)
u(t)-r(t)+ (2)
S(t)-p+u(0)-r(0)+
(1) и (2) – рекуррентные соотношения Беллмана.