Добавил:

Mr_Penguin Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный исследовательский университет «МИЭТ»

Предмет:

Алгоритмы и структуры данных

Файл:

Лаб. 2 АиСД (Вариант 15).docx

Скачиваний:

Добавлен:

01.09.2024

Размер:

2.5 Mб

Скачать

☆

<<< < Предыдущая 1 23 / 83 4 5 6 7 8 > Следующая >>>

Виды обхода бинарных деревьев

Наиболее распространены три способа обхода узлов дерева, выше

получили следующие названия (рис.5):

1) обход в направлении слева направо (обратный порядок, инфиксная запись);

2) обход сверху вниз (прямой порядок, префиксная запись);

3) обход снизу вверх (концевой порядок, постфиксная запись).

Параллельные методы умножения блочнопредставленных матриц

Алгоритм Фокса

Для организации параллельных вычислений при блочном представлении матриц предположим, что процессоры образуют логическую

прямоугольную решетку размером k×k (обозначим через pij процессор,

располагаемый на пересечении i строки и j столбца решетки).

Основные положения параллельного метода, известного как алгоритм Фокса, состоят в следующем:

 каждый из процессоров решетки отвечает за вычисление одного

блока матрицы C;

 в ходе вычислений на каждом из процессоров pij располагаются

четыре матричных блока: блок Сij матрицы C, вычисляемый процессором; блок Aij матрицы A, размещенный в процессоре перед началом вычислений; блоки

Aij’ и Bij’ - матриц A и B, получаемые процессором в

ходе выполнения вычислений.

Выполнение параллельного метода включает:

1) этап инициализации, на котором на каждый процессор pij передаются блоки Aij, Bij и обнуляются блоки Cij на всех процессорах;

2) этап вычислений, на каждой итерации l (1 ≤ l ≤ k) которого выполняется:

 для каждой строки l (1 ≤ l ≤ k) процессорной решетки блок Aij

процессора pij пересылается на все процессоры той же строки i; индекс

j, определяющий положение процессора pij в строке, вычисляется по со-

отношению j = (i +l ‒ 1) mod (k +1), (mod - операция получения остатка

от целочисленного деления);

 полученные в результате пересылок блоки Aij’ и Bij’

каждого процессора pij перемножаются и прибавляются к блоку Cij: Cij = Cij +

Aij’ × Bij’;

 блоки Bij’каждого процессора pij пересылаются процессорам pij,

являющимся соседями сверху в столбцах процессорной решетки (блоки

процессоров из первой стр решетки пересылаются процессорам последней строки решетки).

Алгоритм Кэннона

Отличие алгоритма Кэннона от алгоритма Фокса состоит в изменении схемы начального распределения блоков перемножаемых матриц

между процессорами вычислительной системы. Начальное расположение блоков в алгоритме Кэннона подбирается таким образом, чтобы

располагаемые блоки на процессорах могли быть перемножены без каких-либо дополнительных передач данных между процессорами. При

этом подобное распределение блоков может быть организовано таким

образом, что перемещение блоков между процессорами в ходе вычислений может осуществляться с использованием более простых коммуникационных операций.

С учетом высказанных замечаний этап инициализации алгоритма

Кэннона включает выполнение следующих операций передач данных:

 на каждый процессор pij передаются блоки Aij, Bij;

 для каждой строки i процессорной «решетки» блоки матрицы A

сдвигаются на (i - 1) позиций влево;

 для каждого столбца j процессорной «решетки» блоки матрицы В

сдвигаются на (j - 1) позиций вверх.

В ходе вычислений на каждой итерации алгоритма Кэннона каждый блок матрицы A сдвигается на один процессор влево по решетке, а

каждый блок матрицы В - на один процессор вверх.

<<< < Предыдущая 1 23 / 83 4 5 6 7 8 > Следующая >>>

Соседние файлы в предмете Алгоритмы и структуры данных

#
01.09.2024200.5 Кб8Лаб. 1 АиСД (Вариант 15).docx
#
01.09.20242.5 Mб8Лаб. 2 АиСД (Вариант 15).docx
#
01.09.202464.01 Кб6Лаб. 3 АиСД (Вариант 15).docx
#
01.09.2024176.29 Кб5Лаб. 4 АиСД (Вариант 15).docx