Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Балтийский федеральный университет им. И.Канта

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

__Динамическое программирование_специалитет.doc

Скачиваний:

Добавлен:

01.05.2025

Размер:

2.74 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 78 / 248 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 > Следующая >>>

Тема 5. Дискретные и непрерывные задачи.

План лекции:

Непрерывные процессы.

Траекторный процесс.

Неоднородная атмосфера.

Причинность.

Стохастичность и корреляция.

Вариационное исчисление.

Геометрическая интерпретация.

Уравнение эйконала (в R²).

Краткое содержание лекции

Непрерывные процессы

Рассмотрим дискретный процесс, заданный соотношениями:

p_i₊₁ = T(p_i)

Пусть этим значениям i соответствует значения t = 0, , 2, …

Тогда в силу непрерывности T(p)  p, а точнее

T(p) = p + S(p) + o()

Пусть соответствующая целевая функция имеет вид суммы

f_t(p) = g(p) + g(T(p)) + g(T²(p)) + … + g(Tⁿ(p))

И предположим, промежуток  достаточно мал. Если обозначим t = n, то получим

f_t+_(p) = g(p) + f_t(p + S(p) + o())

Рассмотрим теперь M-мерный случай, получим

Тогда уравнение для целевой функции примет вид

Если перейдем к пределу при 0, то получим линейное уравнение в частных производных

Формально

p(t) = S(p),

p(0) = p₀

Траекторный процесс

Рассмотрим задачу: в пустоте с малой скоростью v брошено вертикально вверх тело. Найти наибольшую высоту подъёма тела. Классическое решение задачи имеет вид:

Способ динамического программирования. Пусть f(v) – максимальная высота

Последовательно получаем:

  0

T(v) = v - g

f(v) = v + f(v - g) + o()

  0  0 = v - f(v)g, f(0) = 0 

Задача (объект А догоняет объект Б). Пусть f(r,d) – время до встречи, g(r,d) – расстояние до точки встречи.

Получаем уравнение

Если   0, то разложив f в правой части по формуле тейлора, получим уравнение в частных производных для функции f и граничное условие для f:

Найти f(r,d); составить уравнение для g(r,d); найти g(r,d) (методом характеристик).

Неоднородная атмосфера

Пусть теперь задача о теле, брошенном вверх, имеет вид (движение с сопротивлением):

x = h(x,x),

x(0) = 0,

x(0) = v

Следовательно нужна дополнительная переменная состояния – высота в начале процесса (b). Пусть f(b,v) – максимальная высота.

Последовательно получаем

b₁ = T₁(b,v) = b + v + o()

v₁ = T₂(b,v) = v + h(b,v) + o()

f(b,v) – max высота 

f(b,v) = v + f(b+v,v+h(b,v)) + o()

  0 

f = -b + (const),

где const – первый интеграл.

Самостоятельно рассмотреть конкретный пример h(x,x) = -g - kx.

Причинность

Рассмотрим последовательно идущие стадии процесса

В предположении зависимости параметров только от предшествующих состояний получаем

f(b,t+) = f(f(b,t),)

это и есть принцип детерминизма. Например для матрицы A получаем

e^A⁽^t⁺^⁾ = e^Ate^A^

Если e^At – есть решение уравнения x = Ax, x(0) = E.

Самостоятельно рассмотреть случаи sin(t+) и cos(t+)

Стохастичность

Пусть T не полностью известно, тогда (p₀, р₁, р₂, …) – случайный процесс, следовательно получаем систему с описанием

p_k = T(p_k-1, r_k), k1,

p₀ = p,

где r_k - независимые случайные величины с распределением dG(r).

Требуется найти математическое ожидание.

M(g(p)) = M(g(p₁) + g(p₂) + …+g(p_N))

Обозначим

f_N(p) = M_r(p_m, р_m₊₁, р_m₊₂, …, р_n, …), N1,

где математическое ожидание берётся относительно независимых случайных величин r₁, r₂, …, r_N. Тогда получим

f_N(p) = g(p) + f_N-1(T(p, r₁)dG(r₁)

f₀(p) = g(p)

(т.к. f_N(p) = M_r(g(p) + f_N-1(T(p, r₁)))

Корреляция

Случайные величины r_k могут быть зависимы, простейший случай, когда r_k зависит только от r_k_-1. В этом случае известно распределение dG(r_k, r_k_-1). Тогда

f_N(p,r₀) = g(p) + f_N_-1(T(p,r₁))dG(r₁,r₀)

Вариационное исчисление

Простейшая классическая задача вариационного исчисления имеет вид: найти max J(u), где

J(u) = ₀^t⁰g(u,u)dt,

u(t)  C_[0,_t_0],

u(0) = c.

Обозначим формально

f(c,t₀) = max_uJ(u)

и воспользуемся свойством интеграла ₀^t⁰ = ₀^ + _^t⁰.

Учтя, что

₀^g(u,u)dt = g(c,v) + o(), (где v = u(0)) получим:

f(c,t₀) = max_v(g(c,v) + f(c+v, t₀-)) + o()

И далее учитывая, что   0 получаем:

f_t₀ = max_v(g(c,v) + vf_c), f(c,0) = 0

Замечание. v = v(c,t) называется функцией стратегии

Замечание. В классическом подходе решается уравнение:

При этом если, например, дополнительно задано условие |u(t)|k, 0tt₀, то в классическом подходе возникают серьёзные трудности, а метод динамического программирования легко даёт уравнение:

f_t0 = max_|v|__k(g(c,v) + vf_c),

f(c,0) = 0

Геометрическая интерпретация

Вариационное исчисление: ищем кривую u(t), t[0,T], такую, что J(u)  max, а u – точка в пространстве функций. Динамическое программирование: для каждой точки ищем направление, которое является оптимальным.

Иначе: кривая – геометрическое место точек (В. И.)

кривая – огибающая семейства касательных (Д. П.)

Уравнение эйконала (в R²)

Пусть дано распределение коэффициента преломления среды в виде n(x,y), тогда скорость луча v(x,y) = c/n(x,y).

По принципу Ферма путь луча такой, что время  min.

Пусть это время от точки (x₀,y₀) до точки (x,y) есть t(x,y).

Пусть угол наклона , тогда заменим

(x,y) (x+cos,y+sin) и t = /v(x,y).

Последовательно получаем:

t(x,y) = min_(/v(x,y) + t(x+cos,y+sin) + o()) 

0 = min_(/v(x,y) +  t_x cos +  t_y sin + o()) 

-v^-1(x,y) = min_(t_x cos + t_y sin)

_min : -t_x sin + t_y cos = 0  tg = t_y/t_x 

Это и есть уравнение эйконала, запишем его в исходных обозначениях

Выводы

Процедура решения непрерывных задач методом динамического программирования для задач, описываемых в терминах траекторных процессов приводит к уравнению в частных производных. Сравним классический подход и метод ДП по сложности численного решения в одномерном случае (N – число узлов)

	Классические методы	Метод ДП
Одиночная задача	N	N²
Серия задач	N²	N²

Таким образом при решении серии задач метод ДП конкурирует с классическими.

<<< < Предыдущая 1 2 3 4 5 6 78 / 248 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
20.12.2018190.98 Кб5zhukovsky.doc
#
28.08.2019246.27 Кб6Ziza_E_N_Metodicheskoe_posobie_2-_versia_2.doc
#
10.02.2015486.77 Кб10zolov.pdf
#
01.05.2025268.8 Кб0_gs_de_f8_48_32268-126305815946072.doc
#
01.05.202582.94 Кб0_images_metodichka_po_proektam.doc
#
01.05.20252.74 Mб3__Динамическое программирование_специалитет.doc
#
01.07.20251.79 Mб4_Ференци Шандор, Тело и подсознание.doc
#
01.05.202566.42 Кб0А ЦНС.docx
#
01.11.2018696.83 Кб147А.В.Гармаш, Н.М.Сорокина - Метрологические осно....doc
#
10.02.20156.66 Mб15А.Н. Головистикова, Ю.А. Дмитриев.doc
#
10.02.20152.78 Mб261А.Х.Саидов. Сравнительное правоведение.doc