Вычисление параллельного префикса

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский государственный технический университет им. H.Э.Баумана

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Ответы 2014.doc

Скачиваний:

Добавлен:

01.07.2025

Размер:

2.93 Mб

Скачать

☆

<<< < Предыдущая 31 32 33 34 35 36 37 38 39 40 41 42 43 44 4546 / 5546 47 48 49 50 51 52 53 54 55 > Следующая >>>

Вычисление параллельного префикса

i-й префикс – это какая-либо ассоциативная бинарная операция, выполняемая на элементах первых i процессоров. Для решения такого типа задач сначала необходимо получить:

1. операцию на первых двух элементах ;

2. - операция с участием трех процессоров;

21.1

Достоинства и недостатки видов соединений вычислительных модулей в высокопроизводительных вс. Шина. Кольцо.

Существуют следующие абстрактные уровни связанности между собой процессорами:

Мультиплексорная. 2. Системная. 3. Кластерная. 4. Сетевая.

Пр

– самая сильно связанная

ОП

ОС

– степень связанности определяется тем, каким образом процессоры мультипроцессорной системы используют системную память. Если память – общая, то связь – сильная, если процессоры имеют локальную память, то связь - менее сильная.

Сетевое ПО

– на уровне ОС – если система однородная и включает симметричные процессоры, то способ организации в таких системах – симметричная мультипроцессорная система.

Пр+Пам = ядро мультипроцессорной системы, к которой могут быть подключены внешние устройства. На основе ядра и внешних устройств создаются кластеры. Если ОС разнородны (система является гетерогенной), то для организации связи требуется увеличение усилия, следовательно уровень абстракции значений возрастает.

4 – самый высокий уровень абстракции – когда отдельные системы мультипроцессоров объединяются на основе сетевых технологий.

Большое значение имеет решение следующих проблем:

Определение способов адресации пунктов назначения и пунктов отправления.
Выбор ширины шины, по которой передается информация (с возрастанием ширины возрастает пропускная способность, но возрастает и стоимость).
Частота тактирования шины при передаче данных.
Количество автономных путей передачи информации.

При создании высокопроизводительных комплексов исп. следующие типы соединений:

1.Дерево; 2. Шина; 3. Кольцо; 4. Решетка; 5. Конвейер; 6. Тороидальная матрица;

7. Структура “бабочка”; 8. Улучшенный вариант бабочки.; 9. Гиперкуб.

7,8 – преобразования Фурье, архитектура подобрана под задачу; 8 – большое число процессоров, большое число операций, сразу проводится 8 умножений, а не 4. 9 – нумерация вершин куба подчиняется правилу: номера соседних вершин должны отличаться только на единицу физического разряда. Следовательно, адрес будет состоять из меньшего числа разрядов.

Гиперкуб:

Одномерный путь передачи информации (отсутствует параллелизм передачи информации).

Дерево. Достоинства: возможность не только передачи информации, но и ее поиска

Недостатки: временная задержка при подключении узлов дерева

Шина. Недостатки: временные задержки при передаче информации, связанные с монополизацией шины на все время передачи информации.
Кольцо. Недостатки: низкая надежность, если нет дублирующего кольца (при разрыве вся система выходит из строя)
Решетка. Недостатки: при увеличении диаметра решетки (если брать дальние друг от друга узлы) уменьшается скорость
Конвейер. Недостатки: длит-сть фазы определяется самой медленной частью конвейера
Тороидальная матрица. Недостатки: сложность в орг-ии путей передачи информации.

*** Диаметр сети – наидлиннейший путь.

Параллелизм передачи информации: попытки создания высокоточных путей привели к созданию структур 7-9, где информация может передаваться одновременно параллельно по многим направлениям, следовательно возрастает производительность сети.

Матричные сети процессоров Н аибольшая степень связности = 4. На основе матричной сети процессоров можно строить различные конфигурации, которые будут наиболее эффективны для определенных типов решаемых задач. Матричную сеть можно рассматривать как набор линейных сетей процессоров, установленных одна над другой и взаимосвязанных. Поэтому каждую строку и каждый столбец можно рассматривать как линейку процессоров. Поэтому все алгоритмы, предназначенные для решения различных типов задач, можно использовать для решения тех е задач на матричных процессорах. Циклический сдвиг в матричной сети процессоров осуществляется одновременно в каждой строке и каждом столбце. Матричные сети используются для решения тех задач, которые связаны с выполнением полугрупповых операций. Кроме того, в матричной системе очень легко решается задача копирования данных по процессорам путем сдвига. Задача сортировки так же легко выполнима.

Древовидная структура процессоров

Дерево формируется как бинарное с n процессорами на базовом уровне. Такое дерево имеет в общей сложности процессоров.

М аксимальная связанность = 3. Диаметр сети меньше, чем в других структурах. Выполнение операций в дереве (таких, как поиск минимума или максимума) требует гораздо меньше времени, чем при использовании других архитектур процессоров. Задача сортировки выполняется значительно хуже, т.к. идет пересылка от левых крайних элементов к крайним правым. Недостаток: трудность решения задач, связанных с частым перемещением данных. Преимущество: быстрое выполнение операция объединения данных, что свойственно задачам трансляции. Целесообразно объединить древовидные структуры с матричными. Полученные в результате структуры – пирамидальные.

Пирамидальные структуры процессоров

О снование пирамиды (уровень 0) – матрица процессоров. Уровень 1 – также матрица процессоров. Уровень 2 – вершина. Пирамиду, в основании которой n процессоров, можно рассматривать как сеть процессоров, соединенных как четверичное дерево, в котором на каждом уровне находится матрица процессоров, соединенных с нижележащими процессорами. Использование такой структуры позволяет решать сложные задачи, связанные с одновременным выполнением элементарных операций.

Если в основании n процессоров, то общее количество вершин = . Каждый процессор основания связан с 4-мя своими соседями и со своим предком. Максимальная степень = 9. Диаметр сети = .

Древовидно-матричная структура процессоров

М аксимальная степень = 6, при этом процессоры по краям матрицы имеют меньшее число связей. Процессоры, находящиеся непосредственно в матрице называются процессорными листьями. Диаметр сети: количество путей значительно больше, чем в других архитектурах, что приводит к созданию более эффективных алгоритмов. Передавать информацию можно одновременно в разных направлениях.

Основные преимущества:

высокая гибкость;
высокая скорость передачи данных;
простота организации.

Гиперкуб

С тепень строго не определена. В отличие от других архитектур связанность в гиперкубе можно наращивать. Степень одинакова для всех вершин. Отсутствие фиксированной архитектуры является и недостатком. Диаметр гиперкуба пропорционален , где n – число вершин. При этом между любой парой вершин гиперкуба существует путь минимальной длины. Особенностью гиперкуба является возможность моделирования на нем других сетевых архитектур. Тогда ребра куба моделируют каналы передачи информации.

<<< < Предыдущая 31 32 33 34 35 36 37 38 39 40 41 42 43 44 4546 / 5546 47 48 49 50 51 52 53 54 55 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
25.08.20193.86 Mб17ОТ ПЗ 8 Зан 9-3.doc
#
16.09.201971.59 Кб8Ответв ВТП Зачет 44-58.docx
#
09.02.2015648.91 Кб109Ответник по Урусову.docx
#
21.09.2019585.08 Кб13ответы 1-41.docx
#
09.02.2015162.99 Кб28ответы по С++ 1-9.docx
#
01.07.20252.93 Mб0Ответы 2014.doc
#
21.09.2019483.97 Кб14Ответы 21-60.docx
#
24.04.201929.86 Кб24Ответы 29 - 37.docx
#
21.09.2019389.81 Кб108ответы 42-80.docx
#
16.04.20191.69 Mб74ОТВЕТЫ ВСЕ.docx
#
16.09.20191.12 Mб191ответы ВТП 1-25.docx