Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский государственный университет им. М.В. Ломоносова

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Динамическое программирование.doc

Скачиваний:

Добавлен:

05.11.2018

Размер:

1.1 Mб

Скачать

☆

<<< < Предыдущая 12 / 52 3 4 5 > Следующая >>>

1. Перемножение нескольких матриц

Мы хотим найти произведение

A₁A₂....A_n (1)

последовательности п матриц (A₁A₂....A_n). Мы будем пользоваться стандартным алгоритмом перемножения двух матриц в качестве подпрограммы. Но прежде надо расставить скобки в (16.1), чтобы указать порядок умножений. Будем говорить, что в произведении матриц полностью расставлены скобки (product is fully parenthesized), если это произведение либо состоит из одной-единственной матрицы, либо является заключенным в скобки произведением двух произведений с полностью расставленными скобками. Поскольку умножение матриц ассоциативно, конечный результат вычислений не зависит от расстановки скобок. Например, в произведении A₁A₂A₃A₄ можно полностью расставить скобки пятью разными способами:

(A₁(A₂(A₃A₄))), (A₁((A₂A₃)A₄)), ((A₁A₂)(A₃A₄)), ((A₁(A₂A₃))A₄), (((A₁A₂)A₃)A₄);

во всех случаях ответ будет один и тот же.

Не влияя на ответ, способ расстановки скобок может сильно повлиять на стоимость перемножения матриц. Посмотрим сначала, сколько операций требует перемножение двух матриц. Вот стандартный алгоритм (rows и columns обозначают количество строк и столбцов матрицы соответственно):

int p,q,w,r;

double Matrix_Multiply(float a[p][q], b[w][r], c[p][r]);

{if (q!=w) {cout<<"умножение невозможно"}

else {for (i=1;i<=p;i++)

{for (j=1;j<=r;j++)

{c[i][j]=0}

for(k=1;k<=q;k++)

{c[i][j]=c[i][j]+a[i][k]*b[k][j]}}

return c}

Матрицы А и В можно перемножать, только если число столбцов у A равно числу строк у В. Если А—это (р* q) матрица, а В—это (q* r)-матрица, то их произведение С является (р*r)-матрицей. При выполнении этого алгоритма делается pqr умножений (строка 7) и примерно столько же сложений. Для простоты мы будем учитывать только умножения.

Чтобы увидеть, как расстановка скобок может влиять на стоимость, рассмотрим последовательность из трех матриц (A₁A₂A₃).размеров 10 х 5 100 х 5 и 5 х 50 соответственно. При вычислении ((A₁A₂)A₃).нужно 10x100x5 — 5000 умножений, чтобы найти (10 х 5)-матрицу А₁А₂ , а затем 10x 5x50=2500 умножений, чтобы умножить эту матрицу на A₃. Всего 7500 умножений при расстановке скобок (A₁₍A₂A₃)) мы делаем 100 х 5 х 50 = 25000 умножений для нахождения (100 х 50)-матрицы A₂A₃ плюс ещё 10 х 100 х 50 - 50000 умножений (умножение А₁ на A₂A₃), итого 75 000 умножений. Тем самым, способ расстановки скобок в 10 раз выгоднее.

Задача об умножении последовательности матриц (matrix-chain multipltion problem) может быть сформулирована следующим образом: дана последовательность из п матриц (A₁,A₂,..., A_n) заданных размеров (матрица А_i, имеет размер p_i_-1 x p_i); требуется найти такую (полную) расстановку скобок в произведении А₁А₂ ...A_n, чтобы вычисление произведения требовало наименьшего числа умножений.

Количество расстановок скобок

Прежде чем применять динамическое программирование к задаче об умножении последовательности матриц, стоит убедиться, что простой перебор возможных расстановок скобок не даст эффективного алгоритма. Обозначим символом Р(п) количество полных расстановок скобок в произведении п матриц. Последнее умножение может происходить на границе между k-й и (k + 1) матрицами. До этого мы отдельно вычисляем произведение первых k и остальных п-k матриц. Поэтому

Стало быть, число расстановок экспоненциально зависит от n, так что полный перебор неэффективен. [Другой способ понять, что число вариантов экспоненциально: разобьём матрицы на группы по три; произведение для каждой группы можно вычислить двумя способами, так что для Зn матриц есть нс менее 2ⁿ вариантов.]

Шаг 1: строение оптимальной расстановки скобок

Если мы собираемся воспользоваться динамическим программированием, то для начала должны описать строение оптимальных решений. Для задачи об умножении последовательности матриц это выглядит следующим образом. Обозначим для удобства через A_i_.._j, матрицу, являющуюся произведением A_iA_i_+1.... A_j. Оптимальная расстановка скобок в произведении A_iA_i_+1.... A_n разрывает последовательность между А_k и A_k₊₁некоторого k, удовлетворяющего неравенству 1≤k < п. Иными словами, при вычислении произведения, диктуемом этой расстановкой скобок, мы сначала вычисляем произведения А_1..._k и A_k_+1..._n , а затем перемножаем их и получаем окончательный ответ А_1.._n. Стало быть, стоимость этой оптимальной расстановки равна стоимости вычисления матрицы A_1..._k плюс стоимость вычисления матрицы A_k_+1.._n плюс стоимость перемножения этих двух матриц.

Чем меньше умножений нам потребуется для вычисления A_1.._k и A_k_+1.._n , меньше будет общее число умножений. Стало быть, оптимальное решение задачи о перемножении последовательности матриц содержит оптимальные решения задач о перемножении её частей.

Шаг 2: рекуррентное соотношение

Теперь надо выразить стоимость оптимального решения задачи через стоимости оптимальных решений её подзадач. Такими подзадачами будут задачи об оптимальной расстановке скобок в произведениях A_i_.._j=A_iA_i₊₁...A_j. Обозначим через m[i,j] минимальное количество умножений, необходимое для вычисления матрицы A_i..j; в частности, стоимость вычисления всего произведения А_1.._n есть m[1,n].

Числа m[i,j] можно вычислить так. Если i = j, то последовательность состоит из одной матрицы А_i_.._i = Ai и умножения вообще не нужны. Стало быть, m[i,i] = 0 для i = 1,2,... ,n. Чтобы подсчитать m[i,j] для i < j, мы воспользуемся информацией о строении оптимального решения, полученной на шаге 1. Пусть при оптимальной расстановке скобок в произведении А_iА_i_-1Aj последним идет умножение A_i...A_k на A_k₊_i... А_j где i≤ k < j. Тогда m[i,j] равно сумме минимальных стоимостей вычисления произведений A_i_.._k и A_k_+1.._jплюс стоимость перемножения этих двух матриц. Поскольку для вычисления произведения A_i_.._kA_k_+1.._j требуется р_i-1p_kp_j умножений,

m[i,j] =m[i,k] + m[k + 1, j] +p_i-1p_kp_j

В этом соотношении подразумевается, что оптимальное значение k неизвестно; на деле это не так. Однако число k может принимать всего j- i различных значений: i,i+1,...,j-1. Поскольку одно из них оптимально достаточно перебрать эти значения k и выбрать наилучшее. Получаем рекурентную формулу:

(2)

Числа m[i,j]—стоимости оптимальных решений подзадач. Чтобы проследить за тем, как получается оптимальное решение, обозначим через s[i,j] оптимальное место последнего умножения, то есть такое , что при оптимальном вычислении произведения A_iA_i₊₁...A_j, последним идет умножение А_i... A_k на A_k₊₁... A_j. Иными словами, s[i,j] равно числу k, для которого m[i,j] = m[i, k] + m[k + 1,j] + p_i_-1p_kp_j

Шаг З: вычисление оптимальной стоимости

Пользуясь соотношениями (2), теперь легко написать рекурсивный алгоритм, определяющий минимальную стоимость вычисления произведения A₁A_2...A_n (т.е. число m[1,n]). Однако время работы такого алгоритма экспоненциально зависит от n, так что этот алгоритм не лучше полного перебора. Настоящий выигрыш во времени мы получим, если воспользуемся тем, что подзадач относительно немного: по одной задаче для каждой пары (i,j), для которой 1 ≤i≤ j≤n, а, а всего С_n² + п = 0(n²). Экспоненциальное время работы возникает потому, что рекурсивный алгоритм решает каждую из подзадач по многу раз, на разных ветвях дерева рекурсии. Такое “перекрытие подзадач” характерный признак задач, решаемых методом динамического программирования.

Вместо рекурсии мы вычислим оптимальную стоимость “снизу вверх”. В нижеследующей программе предполагается, что матрица А_i имеет размер p_i_-1* p_i_-1 при i = 1,2,..., п. На вход подаётся последовательность p= (p₀,p₁,...,p_n), length = п + 1. Программа использует вспомогательные таблицы m[1..n,1..n] (для хранения стоимостей m[i,j]) и s[1..n, 1..n] (в ней отмечается, при каком достигается оптимальная стоимость при вычислении m[i,j]).

float pp[z];

double Matrix_Chain_Order(float pp[z]);

{n=z-1;

for (i=1;i<=n;i++) {m[i][i]=0}

for (l=2;l<=n;l++)

{for (i=1;i<=n-l+1;i++)

{j=i+l-1;

m[i][j]=1/0

for (k=i;i<=j-1;k++)

{q=m[i][k]+m[k+1][j]+p[i-1]*pp[k]*pp[j];

if (q<m[i][j]) {m[i][j]=q;

s[i][j]=k}}};

return m,s;}

Заполняя таблицу m, этот алгоритм последовательно решает задачи об оптимальной расстановке скобок для одного, двух, ..., п сомножителей. В самом деле, соотношение (2) показывает, что число m[i,j]—стоимость перемножения j-i+1 матриц — зависит только от стоимостей перемножения меньшего (чем j-i+1) числа матриц. Именно, для k=i,i+1,...,j-1 получается, что A_i_.._k —произведение k - i +1 < j-i+1 матриц, а A_k_+1..._j-произведение j- k < j- i + 1 матриц.

Сначала (в строках 2-3) алгоритм выполняет присваивания т[i,j]=0 для i=1,2,...,n: стоимость перемножения последовательности из одной матрицы равна нулю. При первом исполнении цикла (строки 4-12) вычисляются (с помощью соотношений (2)) значения m[i,i +1] для i=1, 2,...,п -1 —это минимальные стоимости для последовательностей длины 2. При втором проходе вычисляются m[i, i+2] для i = 1,2,...,п -2-минимальные стоимости перемножения последовательностей длины 3, и так далее. На каждом шаге значение m[i,j], вычисляемое в строках 9-12, зависит только от вычисленных ранее значений т[i, k] и m[k + 1,j].

На рис. 1 показано, как это происходит при п = 6. Поскольку мы определяем m[i,j] только для i≤ j, используется часть таблицы, лежащая над главной диагональю. На рисунке таблицы повёрнуты (главная диагональ горизонтальна).

Внизу выписана последовательность матриц. Число m[i,j] --минимальная стоимость перемножения Ai...A_j—находится на пересечении диагоналей, идущих вправо- вверх от матрицы A_i; и влево- вверх от матрицы A_j. В каждом горизонтальном ряду собраны стоимости перемножения подпоследовательностей фиксированной длины. Для заполнения клетки m[i,j] нужно знать произведения p_i_-1p_kp_j. Для k = i,i+1,... ,j - 1 и содержимое клеток, лежащих слева- внизу и справа- внизу от m[i,j].

Простая оценка показывает, что время работы алгоритма matrix-chain-order есть 0(n³). В самом деле, число вложенных циклов равно трём, и каждый из индексов l, i и k принимает не более n значений. Oбъем памяти, необходимый для хранения таблиц m и s, есть 0(n²). Тем самым этот алгоритм значительно эффективнее, чем требующий экспоненциального времени перебор всех расстановок.

Рис. 1. Таблицы m и s, вычисляемые процедурой matirix-chain-order для n=6 матриц следующего размера:

Таблицы повёрнуты так, что главная диагональ горизонтальна. В таблице m используются только клетки, лежащие не ниже главной диагонали, в таблице s — только клетки, лежащие строго выше. Минимальное количество умножений, необходимое для перемножения всех матриц, равно m[1,6] = 15 125. Пары клеточек, заштрихованных одинаковой светлой штриховкой, совместно входят в правую часть формулы в процессе вычисления m[2,5]:

Шаг 4: построение оптимального решения

Алгоритм matrix-chain-order находит минимальное число умножений необходимое для перемножения последовательности матриц. Осталось найти расстановку скобок, приводящую к такому числу умножений.

Для этого мы используем таблицу s[1..n, 1..п]. В клетке s[1,n] записано место последнего умножения при оптимальной расстановке скобок; другими словами, при оптимальном способе вычисления А_1.._n последним идёт умножение A_1.._s_[1,_n_] наA_s_[1,_n_]+1.._n. Предшествующие умножения можно найти рекурсивное значение s[l, ,s[l, n]] определяет последнее умножение при нахождении A_1.._s_[1,_n_], а s[s[1,n]+1,n] определяет последнее умножение при вычислении A_s_[1,_n_]+1.._n. Приведённая ниже рекурсивная процедура вычисляет произведение имея следующие данные: последовательность матриц A=(A₁,A₂,...,A_n), таблицу s, найденную процедурой matrix-chain-order, а также индексы i и j. Произведение A₁A₂...A_n равно matrix-chain-multiply(A,s,1,n).

double Matrix_Chain_Multiply(float a[],float s[][],int i,j);

{if (j>i)

{x=Matrix_Chain_Multiply(a,s,i,s[i][j]);

y=Matrix_Chain_Multiply(a,s,s[i][j]+1,j);

return Matrix_Multiply(x,y);}

else return a[i];}

В примере на рис. 1 вызов matrix-chain-multiply(a, s, 1,6) вычислит произведение шести матриц в соответствии с расстановкой скобок

((A₁(A₂A₃))((A₄A₅)A₆). (3)

[Техническое замечание: следует позаботиться, чтобы при передаче массива s в процедуру не происходило копирования.]

<<< < Предыдущая 12 / 52 3 4 5 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
21.04.2019129.54 Кб7Динамика материальной точки.doc
#
21.04.2019305.66 Кб2Динамика системы материальной точки.doc
#
12.11.20185.13 Mб21Динамика системы материальных точек.doc
#
06.11.20188.55 Mб9Динамика.doc
#
01.05.202548.49 Кб0Динамические методы оценки эф инвест проектов.docx
#
05.11.20181.1 Mб26Динамическое программирование.doc
#
22.11.20182.51 Mб4Династия Рюриковичей.doc
#
01.07.2025200.7 Кб0Динозавры.doc
#
20.11.20194.93 Mб7Диод_Стабилитрон.docx
#
01.05.20251.33 Mб0Диодор Юрьегорский. Раскопки на Юрьевой горе в...doc
#
05.12.2018186.88 Кб0Диоксины.doc