Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МОМ.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
1.05 Mб
Скачать

1)Линейная зависимость и независимость векторов

Набор векторов   называется системой векторов.

Система из  векторов   называется линейно зависимой, если существуют такие числа  , не все равные нулю одновременно, что

(1.1)

Система из   векторов   называется линейно независимой, если равенство (1.1) возможно только при  , т.е. когда линейная комбинация в левой части равенства (1.1) тривиальная.

Замечания 1.2

1. Один вектор   тоже образует систему: при   — линейно зависимую, а при   — линейно независимую.

2. Любая часть системы векторов называется подсистемой.

Свойства линейно зависимых и линейно независимых векторов

1. Если в систему векторов входит нулевой вектор, то она линейно зависима

2. Если в системе векторов имеется два равных вектора, то она линейно зависима.

3. Если в системе векторов имеется два пропорциональных вектора  , то она линейно зависима.

4. Система из   векторов линейно зависима тогда и только тогда, когда хотя бы один из векторов есть линейная комбинация остальных.

5. Любые векторы, входящие в линейно независимую систему, образуют линейно независимую подсистему.

6. Система векторов, содержащая линейно зависимую подсистему, линейно зависима.

7. Если система векторов   линейно независима, а после присоединения к ней вектора   оказывается линейно зависимой, то вектор   можно разложить по векторам  , и притом единственным образом, т.е. коэффициенты разложения находятся однозначно.

Докажем, например, последнее свойство. Так как система векторов   — линейно зависима, то существуют числа  , не все равные 0, что . В этом равенстве  . В самом деле, если  , то  . Значит, нетривиальная линейная комбинация векторов   равна нулевому вектору, что противоречит линейной независимости системы  . Следовательно,   и тогда  , т.е. вектор   есть линейная комбинация векторов  . Осталось показать единственность такого представления. Предположим противное. Пусть имеется два разложения   и  , причем не все коэффициенты разложений соответственно равны между собой (например,  ).

Тогда из равенства   получаем  .

Следовательно, линейная комбинация векторов   равна нулевому вектору. Так как не все ее коэффициенты равны нулю (по крайней мере  ), то эта комбинация нетривиальная, что противоречит условию линейной независимости векторов  . Полученное противоречие подтверждает единственность разложения.

2)МЕТОД ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

Обозначим: S(x, t) - минимальное значение критерия качества Jt из (5) для оптимального процесса, начинающегося в момент t в точке x(t) = x. Этот процесс можно представить состоящим из двух участков: первого шага, на котором выбирается управление u(t) = u, и остальной части (от момента t + 1 до конца процесса). Вклад в критерий качества первого участка процесса равен R(x, u), а вклад второго участка можно, согласно принципу оптимальности, выразить через введенную выше функцию S в виде S(x(t + 1), t + 1). Учитывая, что управление на первом участке должно выбираться из условия минимизации критерия Jt при ограничении (1), получим равенство

Здесь и далее для определенности предполагаем, что функция S, как и ранее введенные в (2), (4) функции f, R, F, непрерывна. Подставляя в полученное соотношение равенство (2), получим основное соотношение метода динамического программирования

t = 0, 1, _, N - 1. (6)

Для оптимального процесса, начинающегося в момент t = N, критерий оптимальности (5) сводится к одному последнему слагаемому. Поэтому имеем

S(x, N ) = F (x). (7)

Соотношение (6) и условие (7), играющее роль начального условия, дают возможность последовательно определить функции S(x, t) при t = N - 1, _ _, 1, 0, а также рассчитать оптимальное управление и оптимальные траектории. Это достигается при последовательной реализации попятной и прямой процедур динамического программирования.

Алгоритм метода динамического программирования 1. Составляется уравнение Беллмана

2. Путем решения в обратном времени уравнения Беллмана («обратный ход») находятся условно-оптимальные управления u*(tx), а также функции Беллмана F(tx) (t = TT – 1, …, 1). 3. С помощью рекуррентных уравнений «прямого хода» определяются оптимальные управления u*(t) и оптимальная траектория движения дискретной динамической системы x*(t) (t = 1, 2, …, T). 4. Находится оптимальное значение показателя качества управления F(0, x0). Замечание. Так как аналитические выражения для условно-оптимальных управлений u*(tx) при решении практических задач получаются редко, то их обычно табулируют, используя некоторую сетку по переменной х. А при вычислении оптимальных управлений   при необходимости, применяют один из алгоритмов интерполяции.

 Пример применения метода динамического программирования

Пусть имеется фирма, состоящая из двух предприятий. Рассмотрим задачу оптимального распределения средств фирмы на протяжении Т лет. На начало планового периода фирма располагала средствами x(0) = x0.  Деятельность предприятий организована таким образом, что средства u, вложенные в предприятие i (i = 1, 2), приносят в течение года доходfi(u), причем часть дохода   поступает в централизованный фонд фирмы. Средства из этого фонда x(t – 1) (t = 1, 2, …, T) в начале годаt определенным образом перераспределяются между предприятиями и идут на их развитие. Обозначим через ui(t) (i = 1, 2) cредства, выделяемые для развития предприятиям в начале года t. Предполагается, что средства централизованного фонда полностью расходуются: Состоянием фирмы будем считать переменную x(t), в качестве управляющих переменных возьмем u1(t) и u2(t). Тогда изменение состояния фирмы будет описываться уравнением Управляющие воздействия удовлетворяют ограничению Показателем качества управления является суммарный доход, полученный от деятельности предприятий в течение Т лет: Приходим к следующей задаче оптимального управления:

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]