Линейная сеть процессоров

Каждый элемент связан с двумя соседями. Степень сети равна 2 для внутренних элементов и 1 – для крайних. Диаметр сети = n.

Пропускная способность = 1.

Пример:

Найти минимум в массиве: 3; 4; 2; 6; 15.

шаг	p1	p2	p3	p4	p5	min
1	3					3
2	4	3				3
3	2	4	3			2
4	6	2	4	3		2
5	15	6	2	4	3	2

Повышение эффективности решения задач на линейной сети процессоров

Разбиение всей последовательности элементов на отдельные группы

Далее ищется минимум на множестве . Это делается либо стандартным способом (см.предыдущую главу), либо гусеничным алгоритмом (tractor thread). В этом алгоритме можно пересылать данные через линейную сеть процессоров в разных направлениях.

П ри использовании тракторного алгоритма одновременно можно решать несколько задач каждым из процессоров: нахождение минимального элемента, максимального элемента, заданного элемента. Все элементарные операции могут быть выполнены за один проход.

Задача сортировки

В этом случае по окончанию ввода данных самый левый процессор должен хранить минимальный элемент. Одновременно происходит засылка данных и их сортировка.

3 , 4, 2. 6, 1, 5

Такт	p₁	p₂	p₃	p₄	p₅	p₆
1	5
2	1	5
3	1	5	6
4	1	5 2	5	6
5	1	2	5 4	5	6
6	1	2	4 3	4	5	6

Преимущество такого подхода:

количество шагов, необходимых для сортировки примерно равно числу элементов. Это оптимальный алгоритм сортировки для линейной сети процессоров. Данный алгоритм аналогичен алгоритму сортировки выбором.

7.3 Перспективы развития vpp (Vector Parallel Processor)

Fujitsu-VPP5000 (vector parallel processing) ), MPP архитектура. Производительность 1 процессора составляет 9.6 Гфлопс, пиковая производительность системы может достигать 1249 Гфлопс, максимальная емкость памяти - 8 Тб. Система масштабируется до 512 узлов. Парадигма программирования на PVP системах предусматривает векторизацию циклов (для достижения разумной производительности одного процессора) и их распараллеливание (для одновременной загрузки нескольких процессоров одним приложением).

На практике рекомендуют следующие процедуры:

• производить векторизацию вручную, цель - перевести задачу в матричную форму. При этом, в соответствии с длиной вектора, размеры матрицы должны быть кратны 128 или 256. • работать с векторами в виртуальном пространстве, разлагая искомую функцию в ряд и оставляя число членов ряда, кратное 128 или 256.

За счет большой физической памяти (доли терабайта), даже плохо векторизуемые задачи на PVP системах решаются быстрее, на системах со скалярными процессорами.

Формирование адреса команды осуществляется на скалярном процессоре (x₁), выборка из ОП (x₂) и декодирование на скалярном процессоре (x₃).

Дальнейшее развитие – класса VPP. Предпосылка развития VPP (причина) –для написания программ для этого класса машин можно было использовать ЯВУ (например, Фортран, PL), т.е. последовательные языки. Следовательно, все накопленное ПО (БД, ППП и тп.) остались без изменений. Для использования же MPP и МКМД требуется разработка параллельных языков, следовательно, разработка новых компиляторов, новых ППП. VPP: Программа пишется последовательно, затем производится векторизация. Этим занимается векторный контроллер. Основная задача векторного контроллера – девекторизация команды, чтобы ее можно было выполнить на арифметическом конвейере и запоминание результата (5) и очистка регистров(6).

<<< < Предыдущая 2 3 4 5 6 7 8 9 10 11 12 1314 / 5514 15 16 17 18 19 20 21 22 23 24 25 26 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
25.08.20193.86 Mб21ОТ ПЗ 8 Зан 9-3.doc
#
16.09.201971.59 Кб10Ответв ВТП Зачет 44-58.docx
#
09.02.2015648.91 Кб111Ответник по Урусову.docx
#
21.09.2019585.08 Кб18ответы 1-41.docx
#
09.02.2015162.99 Кб31ответы по С++ 1-9.docx
#
01.07.20252.93 Mб2Ответы 2014.doc
#
21.09.2019483.97 Кб16Ответы 21-60.docx
#
24.04.201929.86 Кб26Ответы 29 - 37.docx
#
21.09.2019389.81 Кб123ответы 42-80.docx
#
16.04.20191.69 Mб94ОТВЕТЫ ВСЕ.docx
#
16.09.20191.12 Mб212ответы ВТП 1-25.docx