Вычисление параллельного префикса

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский государственный технический университет им. H.Э.Баумана

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Ответы 2014.doc

Скачиваний:

Добавлен:

01.07.2025

Размер:

2.93 Mб

Скачать

☆

<<< < Предыдущая 28 29 30 31 32 33 34 35 36 37 38 3940 / 5540 41 42 43 44 45 46 47 48 49 50 51 52 > Следующая >>>

Вычисление параллельного префикса

i-й префикс – это какая-либо ассоциативная бинарная операция, выполняемая на элементах первых i процессоров. Для решения такого типа задач сначала необходимо получить:

1. операцию на первых двух элементах ;

2. - операция с участием трех процессоров;

и т.д. В конце выполнения операции параллельного префикса последний элемент содержит результат.

63 Гусеничный алгоритм обработки элементов массива. Повышение эффективности решения задач на линейной сети процессоров

Разбиение всей последовательности элементов на отдельные группы

Далее ищется минимум на множестве . Это делается либо стандартным способом (см.предыдущую главу), либо гусеничным алгоритмом (tractor thread). В этом алгоритме можно пересылать данные через линейную сеть процессоров в разных направлениях.

П ри использовании тракторного алгоритма одновременно можно решать несколько задач каждым из процессоров: нахождение минимального элемента, максимального элемента, заданного элемента. Все элементарные операции могут быть выполнены за один проход.

Задача сортировки:

В этом случае по окончанию ввода данных самый левый процессор должен хранить минимальный элемент. Одновременно происходит засылка данных и их сортировка.

3 , 4, 2. 6, 1, 5

Такт	p₁	p₂	p₃	p₄	p₅	p₆
1	5
2	1	5
3	1	5	6
4	1	5 2	5	6
5	1	2	5 4	5	6
6	1	2	4 3	4	5	6

Преимущество такого подхода:

количество шагов, необходимых для сортировки примерно равно числу элементов. Это оптимальный алгоритм сортировки для линейной сети процессоров. Данный алгоритм аналогичен алгоритму сортировки выбором.

Вычисление параллельного префикса

1. операцию на первых двух элементах ;

2. - операция с участием трех процессоров;

и т.д. В конце выполнения операции параллельного префикса последний элемент содержит результат.

65 Реализация фундаментальных вычислительных алгоритмов в матричной сети процессоров.

Н аибольшая степень связности = 4.

На основе матричной сети процессоров можно строить различные конфигурации, которые будут наиболее эффективны для определенных типов решаемых задач.

Матричную сеть можно рассматривать как набор линейных сетей процессоров, установленных одна над другой и взаимосвязанных. Поэтому каждую строку и каждый столбец можно рассматривать как линейку процессоров. Поэтому все алгоритмы, предназначенные для решения различных типов задач, можно использовать для решения тех е задач на матричных процессорах. Циклический сдвиг в матричной сети процессоров осуществляется одновременно в каждой строке и каждом столбце.

Матричные сети используются для решения тех задач, которые связаны с выполнением полугрупповых операций. Кроме того, в матричной системе очень легко решается задача копирования данных по процессорам путем сдвига. Задача сортировки так же легко выполнима.

<<< < Предыдущая 28 29 30 31 32 33 34 35 36 37 38 3940 / 5540 41 42 43 44 45 46 47 48 49 50 51 52 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
25.08.20193.86 Mб21ОТ ПЗ 8 Зан 9-3.doc
#
16.09.201971.59 Кб10Ответв ВТП Зачет 44-58.docx
#
09.02.2015648.91 Кб111Ответник по Урусову.docx
#
21.09.2019585.08 Кб18ответы 1-41.docx
#
09.02.2015162.99 Кб31ответы по С++ 1-9.docx
#
01.07.20252.93 Mб2Ответы 2014.doc
#
21.09.2019483.97 Кб16Ответы 21-60.docx
#
24.04.201929.86 Кб26Ответы 29 - 37.docx
#
21.09.2019389.81 Кб123ответы 42-80.docx
#
16.04.20191.69 Mб94ОТВЕТЫ ВСЕ.docx
#
16.09.20191.12 Mб212ответы ВТП 1-25.docx