Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ответы 2014.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
2.93 Mб
Скачать

Решение задач линейной алгебры на матричной сети процессоров

Н аиболее эффективно решаются задачи, связанные с обработкой матриц. Пусть дана матрица размерности , требуется вычислить элемент .

Суть алгоритма: элементы матриц А и В продвигаются своим соседям соответственно по строкам и столбцам: а – вправо, b – вниз – и поступают в процессоры нижней правой четверти.

Тогда получим:

1-й шаг. Все процессоры, содержащие элементы первой строки матрицы А, пересылают элементы вправо, а процессоры, содержащие элементы первого столбца В, посылают элементы вниз. В процессоре (*) образуется элемент С1,1.

2 -й шаг. Элементы первой строки А продолжают движение вправо, а элементы первого столбца В – вниз. За время, пропорциональное размерности матрицы, происходит вычисление всех элементов.

По производительности алгоритм в n раз более быстрый, чем обычные вычисления.

П ример 3:

Объединение префиксов на матричной сети процессоров.

Шаг 1 – распределение данных по процессорам.

Шаг 2 – циклический сдвиг вправо во всех строках матрицы процессоров с одновременным вычислением суммы. Глобальные префиксы – в правом столбце.

Шаг 3 – циклический сдвиг в правом столбце.

Шаг 4 – циклический сдвиг влево построчно (для обновления данных).

10.1 Достоинства и недостатки видов соединений вычислительных модулей в высокопроизводительных вс. Шина. Кольцо.

Существуют следующие абстрактные уровни связанности между собой процессорами:

  1. Мультиплексорная. 2. Системная. 3. Кластерная. 4. Сетевая.

1

Пр

Пр

1

– самая сильно связанная

2

ОП

ОП

ОС

ОС

2

3

– степень связанности определяется тем, каким образом процессоры мультипроцессорной системы используют системную память. Если память – общая, то связь – сильная, если процессоры имеют локальную память, то связь - менее сильная.

3

Сетевое ПО

Сетевое ПО

4

– на уровне ОС – если система однородная и включает симметричные процессоры, то способ организации в таких системах – симметричная мультипроцессорная система.

Пр+Пам = ядро мультипроцессорной системы, к которой могут быть подключены внешние устройства. На основе ядра и внешних устройств создаются кластеры. Если ОС разнородны (система является гетерогенной), то для организации связи требуется увеличение усилия, следовательно уровень абстракции значений возрастает.

4 – самый высокий уровень абстракции – когда отдельные системы мультипроцессоров объединяются на основе сетевых технологий.

Большое значение имеет решение следующих проблем:

  1. Определение способов адресации пунктов назначения и пунктов отправления.

  2. Выбор ширины шины, по которой передается информация (с возрастанием ширины возрастает пропускная способность, но возрастает и стоимость).

  3. Частота тактирования шины при передаче данных.

  4. Количество автономных путей передачи информации.

При создании высокопроизводительных комплексов исп. следующие типы соединений:

1.Дерево; 2. Шина; 3. Кольцо; 4. Решетка; 5. Конвейер; 6. Тороидальная матрица;

7. Структура “бабочка”; 8. Улучшенный вариант бабочки.; 9. Гиперкуб.

7,8 – преобразования Фурье, архитектура подобрана под задачу; 8 – большое число процессоров, большое число операций, сразу проводится 8 умножений, а не 4. 9 – нумерация вершин куба подчиняется правилу: номера соседних вершин должны отличаться только на единицу физического разряда. Следовательно, адрес будет состоять из меньшего числа разрядов.

Гиперкуб:

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]