Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский государственный институт электроники и математики (технический университет)

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Архитектура ЭВМ - испр.docx

Скачиваний:

Добавлен:

08.02.2015

Размер:

211.45 Кб

Скачать

☆

<<< < Предыдущая 12 / 52 3 4 5 > Следующая >>>

Сравнение последовательных и параллельных алгоритмов

Для сравнения произвольных алгоритмов используем какой-либо исходный последовательный алгоритм, который получается из исходной задачи.

Умножение матрицы 4х4 на вектор 4х1 с помощью 5 СП (систолических процессоров) и использованием матрицы, повёрнутой на 135 градусов, занимает 14 тактов:

Буфер1 Буфер2 модель магазинной памяти (очереди)


			A₄₄
		A₃₄		0
	A₂₄		A₃₃
A₁₄		A₂₃		A₃₂
	A₁₃		A₂₂
		A₁₂		A₂₁
			A₁₁

Процессорное поле

Рис. Модель памяти при вычислении умножения матрицы на вектор с помощью СП. Вычисления начнутся с СП, помеченного кружочком. Шестой СП – резервный.

Матрица А записывается в следующем виде (как ленточная 5-диагональная матрица):

Аппаратным способом умножение реализуется поворотом этой матрицы на 135 градусов. Таким образом, диагонали встают вертикально, и появляется возможность для каждого СП работать с одной диагональю.

В указанной модели памяти значения из буфера1 каждый такт подаются по одному на СП, и далее по цепочке в фазе коммуникации между ними по стрелкам. На выходе из цепочки значения подаются каждый такт по одному в итоговые ячейки и там продвигаются.

Схема продвижения данных по процессорам:

Такт1	B₁
Такт2		B₁
Такт3	B₂		B₁
Такт4		B₂		B₁*a₁₁

………………………………………………………………. и т.д.

Всего при непосредственном подсчёте – 14 тактов.

Алгоритмы

Операция *

Операция +

Операция ->(пересылка)

Последовательный

4*4

(4 элемента в 4 столбцах)

4*4

6*4*4

Параллельный

Время передачи данных для задачи умножения матрицы 4х4 на вектор 4х1

Реализация умножения с накоплением:

а -> рег1

b -> рег2

рег1 * рег2 -> c

c -> рег1

S -> рег2

рег1 + рег2 -> S

Итого (3 + 3) операции на умножение с накоплением.

Критерии сравнения параллельных и последовательных алгоритмов:

Абсолютное время выполнения

Ускорение вычислений

Потенциально возможное ускорение вычислений

Для последовательного алгоритма используется 1 ПЭ, его ускорение будет 1. Для параллельного в данной задаче используется 5 ПЭ, и теоретически возможное максимальное ускорение – в 5 раз. Однако процессорное время используется не полностью, притом процессоры работают через один, поэтому на самом деле ускорение меньше.

Вычислим приблизительное ускорение параллельного алгоритма с 5 СП. Пусть: