Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Владимирский государственный университет им. Столетовых

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Буланкин В.Б / Учебное пособие Гергель В.П..doc

Скачиваний:

195

Добавлен:

22.03.2015

Размер:

1.16 Mб

Скачать

☆

<<< < Предыдущая 6 7 8 9 10 11 12 13 14 15 16 1718 / 3618 19 20 21 22 23 24 25 26 27 28 29 30 > Следующая >>>

Организация параллельных вычислений при

1. Выбор параллельного способа вычислений. При использовании процессоров для умножения матрицына векторможет быть использован ранее уже рассмотренный в пособии параллельный алгоритм построчного умножения, при котором строки матрицы распределяются по процессорам построчно и каждый процессор реализует операцию умножения какой-либо отдельной строки матрицына вектор. Другой возможный способ организации параллельных вычислений может состоять в построенииконвейерной схемы для операции умножения строки матрицы на вектор (скалярного произведения векторов) путем расположения всех имеющихся процессоров в виде линейной последовательности (линейки).

Подобная схема вычислений может быть определена следующим образом. Представим множество процессоров в виде линейной последовательности (см. рис. 4.7):

;

каждый процессор ,, используется для умножения элементовстолбца матрицы иэлемента вектора. Выполнение вычислений на каждом процессоре,, состоит в следующем:

- запрашивается очередной элемент столбца матрицы;

- выполняется умножение элементов и;

- запрашивается результат вычислений предшествующего процессора;

- выполняется сложение значений ;

- полученный результат пересылается следующему процессору.

Рис. 4.7. Состояние линейного конвейера для операции умножения строки матрицы на вектор после выполнения двух итераций

При инициализации описанной схемы необходимо выполнить ряд дополнительных действий:

- при выполнении первой итерации каждый процессор дополнительно запрашивает элемент вектора ;

- для синхронизации вычислений (при выполнении очередной итерации схемы запрашивается результат вычисления предшествующего процессора) на этапе инициализации процессор ,, выполняет () цикл ожидания.

Кроме того, для однородности описанной схемы для первого процессора , у которого нет предшествующего процессора, целесообразно ввести пустую операцию сложения ().

Для иллюстрации на рис. 4.7 показано состояние процесса вычислений после второй итерации конвейера при .

2. Оценка показателей эффективности алгоритма. Умножение первой строки на вектор в соответствии с описанной конвейерной схемой будет завершено после выполнения () параллельных операций. Результат умножения следующих строк будет происходить после завершения каждой очередной итерации конвейера (напомним, итерация каждого процессора включает выполнение операций умножения и сложения). Как результат, общее время выполнения операции умножения матрицы на вектор может быть выражено соотношением:

Данная оценка также является большей, чем минимально возможное время выполнения параллельного алгоритма при. Полезность использования конвейерной вычислительной схемы состоит, как отмечалось в предыдущем пункте, в уменьшении количества передаваемых данных и в более раннем появлении части результатов вычислений.

Показатели эффективности данной вычислительной схемы определяются соотношениями:

, ,

3. Выбор топологии вычислительной системы. Необходимая топология вычислительной системы для выполнения описанного алгоритма однозначно определяется предлагаемой вычислительной схемой – это линейно упорядоченное множество процессоров (линейка).

<<< < Предыдущая 6 7 8 9 10 11 12 13 14 15 16 1718 / 3618 19 20 21 22 23 24 25 26 27 28 29 30 > Следующая >>>

Соседние файлы в папке Буланкин В.Б

#
22.03.20157.48 Mб35Kalayev_IA_rmvs.pdf
#
22.03.20154.53 Mб80Text Uch Pos4сохр.doc
#
22.03.2015438.97 Кб40UCH_POS.PDF
#
22.03.2015255.74 Кб36Воеводин Концепц неогр паралл_ма.pdf
#
22.03.201531.74 Кб28ВСВП вопросы к экзамену 2013.doc
#
22.03.20151.16 Mб195Учебное пособие Гергель В.П..doc
#
22.03.201598.82 Кб23Экз бил ВСВП 2013_230100.62c.doc